Vídeo: Yann LeCun and Christopher Manning discuss Deep Learning and Innate Priors (De novembre 2024)
En un taller sobre AI i futur del treball a principis d’aquest mes, Yann LeCun, director d’IA Research de Facebook i director fundador del Centre de Ciències de Dades de la NYU, va parlar sobre “el poder i els límits de l’aprenentatge profund”. LeCun, que va ser pioner a les xarxes neuronals revolucionàries que es troben en el centre de molts dels avenços recents en AI, es va mostrar entusiasta pels avenços realitzats en els darrers anys en el camp i realista sobre el que aquests sistemes poden i no poden fer.
Hi ha hagut múltiples ones d'AI, va dir LeCun, i va assenyalar que, mentre que l'onada actual s'ha centrat en l'aprenentatge profund, el que ha de venir és "percepció", i els exemples més grans són aplicacions com la imatge mèdica i els automòbils de conducció automàtica. Gairebé totes aquestes aplicacions utilitzen aprenentatge supervisat i la majoria utilitzen xarxes neuronals convolucionals, que LeCun va descriure per primera vegada el 1989 i que es va desplegar per primera vegada en el reconeixement de caràcters en caixers automàtics el 1995. LeCun va dir que la patent en aquestes xarxes caducava el 2007.
Són els grans conjunts de dades amb grans mides de mostra, així com els increïbles canvis en la potència informàtica (ajudats pel treball de Geoffrey Hinton per esbrinar com utilitzar les GPU per al reconeixement d’imatges) que han provocat els canvis més importants en els darrers anys. Fins i tot per a LeCun, els avenços en el reconeixement d’imatges han estat “res menys que sorprenents”. Tot i que la percepció "funciona realment", el que encara falta és raonar.
LeCun va parlar de tres tipus d’enfocaments i de les limitacions de cadascun d’ells. L’aprenentatge de reforç requereix un gran nombre de mostres. És fantàstic per a jocs, ja que el sistema pot executar milions de proves i millorar, però és difícil d’utilitzar al món real, ja que no voleu conduir un cotxe des d’un penya-segat 50 milions de vegades, per exemple, i El temps real és un factor al món real.
L’aprenentatge supervisat, que és la majoria del que veiem ara, requereix una quantitat mitjana de comentaris i està funcionant bé. Tot i això, l’aprenentatge automatitzat supervisat té alguns problemes. LeCun va dir que aquests sistemes reflecteixen el biaix de les dades, tot i que va dir que és optimista aquest problema que es pot superar i creu que és més fàcil eliminar els biaixos de les màquines en comparació amb la gent. Però també és difícil verificar la fiabilitat d’aquests sistemes i decisions difícils d’explicar basades en els resultats d’aquests sistemes, i LeCun va parlar d’aplicacions de préstec com a exemple.
L’aprenentatge no supervisat o predictiu, que actualment s’està investigant per a coses com predir fotogrames futurs en un vídeo, requereix molta informació. L’aprenentatge no vigilat implica predir el passat, el present o el futur a partir de qualsevol informació disponible, o dit d’una altra manera, la capacitat d’emplenar els espais en blanc, que LeCun va dir és efectivament el que anomenem sentit comú. Va assenyalar que els nadons poden fer-ho, però que aconseguir que les màquines hagin estat molt difícils i va parlar de com els investigadors estan treballant en tècniques com les xarxes adversatives generatives (GAN) per a prediccions realitzades en condicions incertes. Estem lluny de tenir una solució completa, va dir.
LeCun va parlar dels tres tipus d’aprenentatge com a part d’un pastís: l’aprenentatge de reforç és la cirera a la part superior, l’aprenentatge supervisat de la guinda i l’aprenentatge predictiu és la part principal del pastís.
LeCun va predir que l'AI canviarà com es valoren les coses, perquè els béns construïts per robots costin menys i les experiències humanes autèntiques costin més, i va dir que això pot significar que existeix "un futur brillant per a músics i artesans de jazz".
En general, LeCun va dir que l'AI és una tecnologia de propòsit general (GPT) com la màquina de vapor, l'electricitat o l'ordinador. Com a tal, afectarà moltes àrees de l’economia, però passarà deu o vint anys abans que es produeixi un efecte en la productivitat. LeCun va dir que l'AI donarà lloc a la substitució de llocs de treball, però va assenyalar que el desplegament de la tecnologia està limitat per la forma en què els treballadors ràpids poden formar-se.
Quant a una "autèntica revolució de l'AI", LeCun va dir que això no passarà fins que les màquines adquireixin sentit comú, i la determinació dels principis per construir-la pot trigar dos, cinc, vint o més anys; més enllà d’això, es necessitaran anys per desenvolupar una tecnologia d’AI pràctica basada en aquests principis. Al cap i a la fi, va assenyalar, van trigar vint anys perquè les xarxes convolutives esdevingessin importants. I tot això es basa en el supòsit que els principis són simples; es fa molt més complicat si "la intel·ligència és un problema".