Vídeo: Небольшой обзор возможностей Skype для конференции\обучения (De novembre 2024)
Si seguissis la revolució informàtica des de la creació del microprocessador, sabríeu que hi ha diverses promeses inicials que encara no s’han de complir.
Un d’aquests és un discurs traduït al llarg del vol, on dius alguna cosa en anglès i es repeteix en un altre idioma, com el castellà, en temps real gairebé. Malgrat que encara està en marxa, Microsoft està ara a un pas més de Skype Translator, la primera fase de la qual es va viure en directe aquesta setmana.
Si es tracta de treballar i no és cap broma, és el producte de la dècada. Ara mateix, Skype Translator admet traduccions del castellà a l’anglès i de l’anglès al castellà, però s’ha de seguir més idiomes.
El problema típic d’aquest tipus de coses és el nivell de dificultat indignant. Encara he de veure un paquet de traducció decent que faci traduccions de text a text que funcionin bé. La traducció de la veu té un nivell de dificultat totalment diferent, sobretot en temps real.
Microsoft té una pel·lícula que mostra dos nens que parlen en espanyol i anglès que fa que sembli que funciona bé. Però vaig veure un sistema similar demostrat per IBM fa gairebé 20 anys que mai va veure la llum del dia. La versió d'IBM es va desenvolupar a la dècada de 1990, quan hi havia una mania de reconeixement de veu dirigida per Lernout & Hauspie, una companyia que es va produir una ruptura, abans de patir un escàndol de fraus el 2001. Abans, però, comprava tota tecnologia de parla. La companyia podria, incloent Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone i altres. Microsoft tenia una participació del 8 per cent en L&H i va acabar amb algunes de les tecnologies com a regal de fallida.
Mireu les miserables traduccions d’ordinador de text a text realitzades per Google i altres usuaris. El text no pot i no pot evitar el més evident dels errors. Res d’això s’aproxima a la complexitat de la traducció de la veu, que comporta un processament intensiu de senyal.
Sóc viticultor i visito sovint els llocs web del celler francès. El meu francès només està bé, així que sovint active la traducció per agilitar la lectura del lloc. Ja estem al 2014 i cap dels traductors pot imaginar que la traducció de Château Margaux és de Château Margaux, no de Castle Margaux. Què tan difícil és abstenir-se i no traduir a la paraula castell una paraula usada habitualment en un nom propi, com ara château, que normalment es refereix a un celler específic? Aparentment és impossible. Tots ho fan.
Què costa escriure alguna excepció al codi que digui al traductor que es troba en un lloc web sobre el vi de Bordeus? Mentre que en aquest lloc la paraula castell no significa castell. Sovint el traductor intentarà descodificar també la resta del nom del castell, amb resultats ridículs. El millor que podeu fer en general amb la traducció de text és fer una idea sobre el que diu el lloc.
Pregunteu-vos: si el text és tan difícil, com gestionarà Microsoft la parla?
És impossible, fins i tot en un mateix idioma. Feu un servei telefònic de Google Voice. Té una funció de presa de missatges de veu a text. Mai he rebut un missatge de veu a text que fins i tot s’apropi al que deia la persona en realitat. Ni una vegada.
Admetré que en una habitació tranquil·la quan parleu de manera clara i clara, el reconeixement de veu funciona bé. L’utilitzo per a missatges de text al meu telèfon Android. Però en una conversa real, ningú parla així. Admiro a Microsoft per haver publicat això. Però no funcionarà segons la publicitat.
Dit això, és almenys amb què jugar. Fins i tot podria desencadenar una nova generació d’investigació. Així que no em queixaré massa.
Tothom vol això. Tornem a treballar-hi.