Casa Notícies i anàlisi Què és l'aprenentatge automàtic?

Què és l'aprenentatge automàtic?

2024

Taula de continguts:

Quina diferència hi ha entre la intel·ligència artificial i l’aprenentatge automàtic?
Aprenentatge tutelat i no tutelat
Aprenentatge de reforç
Aprenentatge profund
Els Límits de l'aprenentatge automàtic

Vídeo: Stromae - Tous Les Mêmes (Clip Officiel) (De novembre 2024)

El desembre de 2017, DeepMind, el laboratori de recerca adquirit per Google el 2014, va introduir AlphaZero, un programa d’intel·ligència artificial que podria derrotar campions del món en diversos jocs de taula.

Curiosament, AlphaZero va rebre zero instruccions dels humans sobre com jugar als jocs (d’aquí el nom). En lloc d'això, va utilitzar l'aprenentatge automàtic, una branca de l'AI que desenvolupa el seu comportament mitjançant l'experiència en lloc d'ordres explícites.

Al cap de 24 hores, AlphaZero va obtenir un rendiment sobrehumà en els escacs i va derrotar l'anterior programa d'escacs del campió mundial. Poc després, l'algoritme d'aprenentatge automàtic d'AlphaZero també va dominar Shogi (escacs japonesos) i el joc de taula xinès Go, i va derrotar el seu predecessor, AlphaGo, 100 a zero.

L’aprenentatge de màquines s’ha popularitzat en els darrers anys i està ajudant a les computadores a resoldre problemes que abans es pensaven com a domini exclusiu de la intel·ligència humana. Tot i que encara queda molt lluny de la visió original de la intel·ligència artificial, l’aprenentatge automàtic ens ha apropat molt a l’objectiu final de crear màquines de pensament.

Quina diferència hi ha entre la intel·ligència artificial i l’aprenentatge automàtic?

Els enfocaments tradicionals per desenvolupar la intel·ligència artificial consisteixen en codificar minuciosament totes les regles i coneixements que defineixen el comportament d’un agent d’AI. Quan es creen una IA basada en regles, els desenvolupadors han d’escriure instruccions que especifiquen com s’ha de comportar l’IA en resposta a totes les situacions possibles. Aquest enfocament basat en regles, també conegut com a antiga AI (GOFAI) o IA simbòlica, intenta imitar les funcions de raonament i representació de coneixement de la ment humana.

Un exemple perfecte d’IA simbòlica és Stockfish, un motor d’escacs de codi obert de primer nivell, de més de 10 anys en la fabricació. Centenars de programadors i jugadors d’escacs han contribuït a Stockfish i han ajudat a desenvolupar la seva lògica codificant les seves regles, per exemple, què hauria de fer l’IA quan l’oponent mogui el seu cavaller de B1 a C3.

Però l'AI basada en regles sovint es trenca quan es tracta de situacions en què les regles són massa complexes i implícites. El reconeixement de la parla i els objectes en imatges, per exemple, són operacions avançades que no es poden expressar amb regles lògiques.

Al contrari de l’IA simbòlica, els models d’AI d’aprenentatge automàtic es desenvolupen no escrivint regles sinó recopilant exemples. Per exemple, per crear un motor d’escacs basat en l’aprenentatge automàtic, un desenvolupador crea un algorisme base i després el “forma” amb dades de milers de jocs d’escacs prèviament jugats. Mitjançant l'anàlisi de les dades, l'AI troba patrons comuns que defineixen estratègies guanyadores, que poden utilitzar per derrotar adversaris reals.

Com més jocs revisi l'AI, millor serà predir les jugades guanyadores durant el joc. És per això que l’aprenentatge automàtic es defineix com un programa el rendiment del qual millora amb l’experiència.

L’aprenentatge automàtic és aplicable a moltes tasques del món real, com ara la classificació d’imatges, el reconeixement de veu, la recomanació de contingut, la detecció de fraus i el processament de llenguatges naturals.

Aprenentatge tutelat i no tutelat

Segons el problema que volen solucionar, els desenvolupadors preparen dades rellevants per construir el seu model d’aprenentatge de màquines. Per exemple, si volguessin utilitzar l'aprenentatge automàtic per detectar transaccions bancàries fraudulentes, els desenvolupadors compilarien una llista de transaccions existents i les etiquetarien amb el seu resultat (fraudulent o vàlid). Quan alimenten les dades a l'algorisme, separa les transaccions fraudulentes i vàlides i troba les característiques comunes dins de cadascuna de les dues classes. El procés de models de formació amb dades anotades s’anomena “aprenentatge supervisat” i actualment és la forma dominant d’aprenentatge automàtic.

Ja existeixen molts repositoris en línia de dades etiquetades per a tasques diferents. Alguns exemples populars són ImageNet, un conjunt de dades de codi obert de més de 14 milions d’imatges etiquetades i MNIST, un conjunt de dades de 60.000 dígits escrits a mà. Els desenvolupadors d'aprenentatge automàtic també utilitzen plataformes com Amazon Turk, un centre de contractació en línia, sota demanda, per realitzar tasques cognitives com ara l'etiquetatge d'imatges i mostres d'àudio. I un creixent sector de startups especialitzat en anotació de dades.

Però no tots els problemes requereixen dades etiquetades. Alguns problemes d’aprenentatge automàtic es poden solucionar mitjançant un “aprenentatge no supervisat”, on proporcioneu al model d’AI dades brutes i deixeu-ho esbrinar per si mateix quins patrons són rellevants.

Un ús comú d’aprenentatge no supervisat és la detecció d’anomalies. Per exemple, un algorisme d’aprenentatge de màquines pot formar-se sobre les dades brutes del trànsit de xarxa d’un dispositiu connectat a Internet, per exemple, un refrigerador intel·ligent. Després de l'entrenament, l'AI estableix una línia de referència per al dispositiu i pot marcar un comportament anterior. Si el dispositiu s’infecta amb programari maliciós i comença a comunicar-se amb servidors maliciosos, el model d’aprenentatge automàtic podrà detectar-lo, perquè el trànsit de xarxa és diferent del comportament normal observat durant l’entrenament.

Aprenentatge de reforç

Ara per ara, probablement sabeu que les dades de formació de qualitat tenen un paper important en l’eficiència dels models d’aprenentatge de màquines. Però l’ aprenentatge de reforç és un tipus especialitzat d’aprenentatge automàtic en què una IA desenvolupa el seu comportament sense utilitzar dades anteriors.

Els models d'aprenentatge de reforç comencen amb una pissarra neta. Només se'ls instrueix les regles bàsiques del seu entorn i la tasca a la seva disposició. Mitjançant la prova i l’error, aprenen a optimitzar les seves accions per als seus objectius.

DeepMind's AlphaZero és un interessant exemple d'aprenentatge de reforç. A diferència d'altres models d'aprenentatge de màquines, que han de veure com els humans juguen escacs i aprenen d'ells, AlphaZero només va començar a conèixer els moviments de les peces i les condicions de victòria del joc. Després d'això, va jugar milions de partits contra si mateix, començant per accions aleatòries i desenvolupant pautes de comportament gradualment.

L’aprenentatge de reforç és un espai d’investigació càlid. És la principal tecnologia utilitzada per desenvolupar models d’IA que poden dominar jocs complexos com Dota 2 i StarCraft 2 i també s’utilitza per resoldre problemes de la vida real, com ara la gestió de recursos del centre de dades i la creació de mans robòtiques que puguin manejar objectes amb destresa humana..

Aprenentatge profund

L’aprenentatge profund és un altre conjunt més popular de l’aprenentatge automàtic. Utilitza xarxes neuronals artificials, construccions de programari que s’inspiren aproximadament en l’estructura biològica del cervell humà.

Les xarxes neuronals excel·len en processar dades no estructurades com ara imatges, vídeo, àudio i llargs extractes de text com articles i treballs de recerca. Abans d’aprenentatge profund, els experts en aprenentatge automàtic havien de fer un gran esforç per extreure funcions d’imatges i vídeos i fer funcionar els seus algoritmes. Les xarxes neuronals detecten automàticament aquestes funcions sense requerir gaire esforç dels enginyers humans.

L’aprenentatge profund està al darrere de moltes tecnologies modernes d’AI com ara cotxes sense conductor, sistemes de traducció avançats i la tecnologia de reconeixement facial del vostre iPhone X.

Els Límits de l'aprenentatge automàtic

La gent sol confondre l'aprenentatge de màquines amb la intel·ligència artificial a nivell humà i els departaments de màrqueting d'algunes empreses utilitzen intencionadament els termes de manera intercanviable. Però, tot i que l’aprenentatge automàtic ha avançat molt cap a la resolució de problemes complexos, encara està molt lluny de crear les màquines de pensament previstes pels pioners de la IA.

A més d’aprendre per experiència, la veritable intel·ligència requereix raonament, sentit comú i pensament abstracte: àrees en què els models d’aprenentatge de màquines funcionen molt malament.

Per exemple, tot i que l’aprenentatge automàtic és bo en tasques complicades de reconeixement de patrons, com predir el càncer de mama amb cinc anys d’antelació, té problemes amb una lògica i tasques de raonament més senzilles, com ara resoldre problemes de matemàtiques de secundària.

La manca de poder de raonament de l'aprenentatge automàtic dificulta la generalització dels seus coneixements. Per exemple, un agent d'aprenentatge de màquines que pot jugar a Super Mario 3 com un professional no dominarà un altre joc de plataforma, com Mega Man, o fins i tot una altra versió de Super Mario. Caldria formar-se des de zero.

Sense poder extreure coneixement conceptual de l'experiència, els models d'aprenentatge automàtic requereixen tones de dades de formació per realitzar-les. Malauradament, molts dominis no tenen dades de formació suficients o no disposen de fons per adquirir-ne més. L’aprenentatge profund, que ara és la forma predominant d’aprenentatge automàtic, també pateix un problema d’explicabilitat: les xarxes neuronals funcionen de maneres complicades, i fins i tot els seus creadors lluiten per seguir els seus processos de decisió. Això fa que sigui difícil utilitzar el poder de les xarxes neuronals en paràmetres on hi ha un requisit legal per explicar les decisions de l'AI.

Afortunadament, s'estan fent esforços per superar els límits de l'aprenentatge automàtic. Un dels exemples destacats és una iniciativa generalitzada del DARPA, el grup de recerca del Departament de Defensa, per crear models d’AI explicables.

Què és la Intel·ligència Artificial (IA)? Què és la Intel·ligència Artificial (IA)?
La majoria dels dòlars d’IA Anem a l’aprenentatge automàtic La majoria dels dòlars AI van a l'aprenentatge automàtic
Com voleu veure utilitzada la IA? Com voleu veure utilitzada la IA?

Altres projectes pretenen reduir la confiança de l'aprenentatge automàtic en dades anotades i fer que la tecnologia sigui accessible als dominis amb dades de formació limitada. Els investigadors d’IBM i MIT han realitzat recentment incursions en el camp combinant IA simbòlica amb xarxes neuronals. Els models d’IA híbrids requereixen menys dades per a la formació i poden proporcionar explicacions pas a pas de les seves decisions.

Queda per veure si l'evolució de l'aprenentatge automàtic ens ajudarà a assolir l'objectiu sempre evitable de crear IA a nivell humà. Però el que sabem segur és que gràcies als avenços en l'aprenentatge de màquines, els dispositius asseguts als nostres escriptoris i que descansen a les butxaques cada dia són més intel·ligents.