Casa Opinions Ai és (també) una força per al bé | ben dickson

Ai és (també) una força per al bé | ben dickson

Taula de continguts:

Vídeo: Тобот (мультсериал) - серии на русском языке / Опенинг! (De novembre 2024)

Vídeo: Тобот (мультсериал) - серии на русском языке / Опенинг! (De novembre 2024)
Anonim

El 2017, Esclerosi Lateral Amiotròfica (ALS), un trastorn neurològic devastador, va robar a Pat Quinn, el fundador del famós Ice Bucket Challenge, de la seva capacitat de parlar.

El 2018, la intel·ligència artificial el va ajudar a recuperar-lo.

Gràcies als avenços en l'aprenentatge de màquines i l'aprenentatge profund, els algorismes d'intel·ligència artificial s'han convertit en molt bons a imitar els humans. Però, encara que molts desenvolupaments destacats a l’espai han estat negatius, el poder d’imitació de l’AI va ser una força de canvi positiu per a Quinn.

"La majoria de les persones que viuen amb ALS (també coneguda com malaltia de neurones motores) acaben paralitzades i no poden comunicar-se amb res més que veus artificials" informàtiques ", afirma Oskar Westerdal, cofundador de Project Revoice, una iniciativa que pretén ajudar pacients amb ALS com Quinn.

Per recrear la veu de Quinn, Project Revoice va col·laborar amb Lyrebird, un grup d’empreses que utilitzen AI per clonar la veu d’una persona: un grup que també inclou WaveNet i Voicery de Google, una arrencada de Y Combinator que utilitza AI per crear enregistraments de veu sintetitzats..

Com genera l'aprenentatge profund les veus humanes

Al darrere d’aquestes aplicacions hi ha algorismes d’aprenentatge profund, una branca popular de l’IA que utilitza grans conjunts de dades per a indicacions i patrons que no es poden captar amb un programari tradicional basat en regles. Quan entrenes un sintetitzador de veu d'aprenentatge profund amb prou enregistraments de veu, crea un model digital que representa la veu de la persona i pot generar noves mostres de veu.

Abans de l’arribada de la tecnologia de síntesi de veu basada en AI, els pacients amb ALS havien d’utilitzar veus digitals genèriques que no eren les seves. Altres tecnologies podrien ajuntar oracions prèviament enregistrades amb la veu del pacient, però els resultats eren massa artificials i van requerir desenes d’hores d’enregistrament de veu de mínim ús.

Les aplicacions d'aprenentatge profund, en canvi, requereixen molt menys dades i proporcionen millors resultats. "El que Lyrebird pot aconseguir amb només dues hores d'àudio és notable; proporciona a la gent un clon de veu digital complet, perquè puguin dir el que vulguin", afirma Westerdal.

Recrear la veu d’una persona sense veu

Un dels límits de les aplicacions d'aprenentatge profund és la seva dependència de mostres de dades d'alta qualitat per entrenar les seves xarxes neuronals. El problema dels pacients amb ALS és que, un cop que perden la veu, és impossible registrar mostres de veu. Afortunadament, Quinn va tenir hores de notes i entrevistes gravades.

"El major repte va ser la qualitat. Aquesta tecnologia depèn completament de tenir enregistraments de qualitat i de qualitat coherents, que també segueixen un guió exacte; així que vam haver de treballar amb un estudi de so per" remasteritzar "manualment i transcriure cada línia de diàleg que podríem trobar. de Pat ", diu Westerdal.

"Teníem una mica de por que no seríem capaços de proporcionar una gran qualitat per crear la veu de Pat", afirma Jose Sotelo, cofundador de Lyrebird. "Com que no podíem obtenir enregistraments nets, la qualitat final de la veu artificial no és perfecta. Pensem que podem fer un treball molt millor amb enregistraments nets."

Els resultats encara sonen una mica antinaturals i sintètics. Però per a Quinn, que havia estat utilitzant una veu genèrica per comunicar-se, la diferència era dramàtica. "Després d'escoltar la meva veu a través d'aquesta nova tecnologia, em van fer volar! Perquè els pacients sàpiguen que poden tenir la seva pròpia veu després que l'ALS l'emporti, canviarà la manera de viure de la gent amb ALS", afirma.

Quinn recomana que els pacients amb ALS enregistrin la seva veu abans que sigui massa tard. "Després de tornar a escoltar la meva pròpia veu, necessito que els pacients amb ALS saben que la gravació de la seva veu és molt important", afirma.

Equilibri dels usos negatius dels sintetitzadors d'AI

A principis d’aquest any, FakeApp, una aplicació de canvi de cara que operava amb tecnologia d’AI, va provocar un atac de falsos vídeos pornogràfics amb famosos i polítics. Hi ha preocupació perquè aplicacions com FakeApp i Lyrebird generaran una nova era de notícies falses, fraus i falsificacions.

La pàgina d’ètica del lloc web de Lyrebird reconeixia anteriorment que la tecnologia "podria tenir conseqüències perilloses com ara diplomàtics enganyosos, fraus i, més generalment, qualsevol altre problema causat per robar la identitat d’una altra persona".

Per impulsar el tema, el lloc web de la companyia inclou diversos enregistraments sintetitzats creats amb les veus de Donald Trump i Barack Obama.

@realDonaldTrump https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk

- AI Lyrebird (@LyrebirdAi) 4 de setembre de 2017

La història de Quinn pot ajudar a posar de manifest els aspectes positius d'una indústria que ha aprofitat els usos potencialment esgarrifosos i poc ètics de les seves aplicacions. "És important que la gent s'adoni de la cara brillant d'aquesta tecnologia", recorda Sotelo de Lyrebird.

A part dels usos mèdics, les aplicacions de sintetitzador d'AI poden servir per a altres objectius productius. Voicery proporciona a les marques veus digitalitzades personalitzades alimentades per algorismes AI. Google també està experimentant amb WaveNet per proporcionar una experiència més natural als usuaris dels seus dispositius alimentats per Google Assistant. Altres àrees on la tecnologia és útil són l’automatització de llibres d’àudio o la facilitació del doblatge de veu en pel·lícules.

Els obstacles ètics i legals no tindran cap mena de dubte i continuaran els debats. Però per a Quinn, l'AI és una força per al bé. "No vull sonar com un ordinador", afirma. "Vull sonar com jo".

Ai és (també) una força per al bé | ben dickson