Taula de continguts:
- 1. No oblideu la logística
- 2. Compteu amb les vostres dades
- 3. Els algoritmes no són bales màgiques
- 4. Utilitzeu un conjunt d’eines divers
- 5. Experimenta amb l'aprenentatge híbrid
- 6. Barat no vol dir malament
- 7. No ho anomenis AI
Vídeo: 7 consells per tenir uns ronyons sans (De novembre 2024)
La primera part de la nostra Guia empresarial sobre aprenentatge automàtic (ML) va desglossar com el concepte paraigua de ML és molt més matisat en un entorn empresarial. Les estratègies més efectives miren ML en un sentit pràctic, que utilitza tant tècniques complexes d’aprenentatge profund i menys intensives d’aprenentatge barat ”per optimitzar els processos empresarials i obtenir informació intel·ligent de negoci tangible (BI).
L’objectiu de desplegar ML dins de les vostres aplicacions empresarials és millorar la vostra línia de fons o pressionar l’avantatge competitiu de la vostra empresa. Però en el pla més gran de la vostra organització, aprofitar al màxim el temps i els recursos que invertiu en aquest procés va molt més enllà dels algorismes. Els responsables de decisió informàtics de la vostra empresa han d’assegurar-se de tot allò que comporta la vostra afectació de ML, des de les dades i la logística fins a la manera en què s’interessen amb els usuaris, treballa de manera cohesionada per optimitzar l’eficàcia.
Ted Dunning, doctor, és el principal arquitecte d'aplicacions de MapR, una empresa de programari empresarial que ofereix diverses distribucions Big Data i eines de gestió de dades. Dunning també ha estat coautor de dos llibres sobre el que es refereix a "Practical Machine Learning" i ha desenvolupat tecnologies ML per a diverses empreses al llarg dels anys, com ara el sistema de detecció de fraus ID Analytics (adquirit per LifeLock) i el programari Musicmatch Jukebox, que després es va convertir en Yahoo Music. Actualment també és vicepresident d’incubació per a la Apache Software Foundation.
Dunning ha vist evolucionar l'espai de la ML durant dècades i ha après moltes coses sobre el que funciona i el que no funciona en un entorn empresarial pràctic. A continuació, Dunning presenta set bones pràctiques a seguir per desenvolupar solucions empresarials arrelades a ML.
1. No oblideu la logística
ML amb èxit no es tracta només de triar l'eina o l'algoritme adequat. Dunning va dir que també cal esbrinar quin és l’enfocament adequat i dissenyar-lo per a la situació particular que s’està tractant. Per exemple, Dunning va parlar de ML en una campanya de màrqueting en línia, en contraposició a escenaris molt més complicats com ara algorismes que guien un cotxe autònom. El fet de gastar els recursos per a una millora de l'algorisme incremental val la pena per al cotxe, però, en l'escenari de màrqueting, podríeu obtenir un rendiment molt millor que l'optimització de tota la logística que l'envolta.
"Sovint, per a les empreses, és la logística, no l'aprenentatge, el que et proporciona el valor. Aquesta és la part en la qual hauràs de dedicar el teu temps i recursos", va dir Dunning. "L'ajustament de l'algorisme suposaria una petita millora. Però ajustar aquestes dades, la GUI i la manera d'escoltar i relacionar-se amb els usuaris us permetrà una millora del 100 per cent. El temps de passar per ajustar l'algorisme val una fracció a mesura que tant per a les empreses com per escoltar els vostres usuaris."
Per il·lustrar aquest punt, Dunning va explicar com va construir un model per identificar el frau de l’aplicació (obertura de comptes falsos amb identitats robades) a la base de dades de clients d’una empresa. El model que va construir va obtenir bons resultats, però Dunning va notar que va ponderar molt el sexe de la sol·licitant.
Va resultar que la logística estava desactivada. De la manera de funcionar el procés de sol·licitud, la sol·licitant només va completar el seu sexe després que ja s’havien convertit en client i haguessin superat diversos passos de detecció per filtrar els estafadors. Així, utilitzant el camp de gènere, el model ML estava fent trampes a la logística de tot el procés de fraus. Això no té res a veure amb l'algoritme i tot té a veure amb la manera en què l'empresa estava rebent les seves dades en primer lloc.
2. Compteu amb les vostres dades
El dunning està ple de savies clares. Després de començar per "és la logística, no l'aprenentatge", va dir que l'altra meitat d'aquesta idea és "són les dades, no els algorismes". Una gran part d’assegurar-vos que els vostres algorismes ML proporcionen informació valuosa us assegureu que els doneu les dades adequades. Dunning va dir que, si no obteniu el resultat pel qual busqueu, moltes vegades, no és perquè no utilitzeu les dades adequades.
"Les persones es lliguen i s'uneixen a ego per a algoritmes particulars, però avui dia, a causa de les eines que hi ha, tothom i la seva mare poden i estan presentant tot tipus de nous algorismes", va dir Dunning. "Les dades són molt més importants i us proporcionaran molt més augment que no pas ajustar els algorismes. Si esteu treballant en un problema dur com el reconeixement de veu o la visió per ordinador, això és una cosa. Però aquest és un camp basat en dades. En la majoria dels escenaris, obtindreu molt més l’ajust de les dades que obteniu i canvieu la pregunta ".
Això és el que va fer Dunning a mitjans dels anys 2000 quan va crear un motor de recomanació de vídeo en una empresa anomenada Veoh Networks. L’equip estava treballant per identificar parells de vídeos generats per l’usuari als quals la gent va fer clic més del que s’esperava, però l’algorisme no funcionava. Estaven pensant en termes de música, on els usuaris coneixen els seus artistes i cançons preferides per nom. Així que van canviar la pregunta ajustant la interfície d'usuari sense tocar l'algorisme.
"En els vídeos generats per l'usuari, ningú no sap que els artistes i molts vídeos tenien títols realment spammy per obtenir més visualitzacions. El ciclisme per ajustar l'algorisme mai no ens ha donat bons resultats", va dir Dunning. "El que vam fer va canviar la interfície d'usuari per emetre un senyal de llum cada 10 segons. Vam trobar que si utilitzem la balisa en lloc de fer clic per obtenir les dades brutes del recomanador, obteníem resultats fantàstics. L'augment d'aquest canvi va ser diversos. millora del cent per cent en la participació a causa de recomanacions, sense canvis algorítmics ".
3. Els algoritmes no són bales màgiques
Les implementacions de ML prosperen en un error i assaig continu. Per molt bons que siguin els vostres algorismes, si el vostre sistema interactua amb els humans, caldrà ajustar-lo amb el temps. Dunning ha destacat que les empreses han de mesurar constantment l'efectivitat general de la seva implementació i identificar els canvis i les variables que la milloren i la deterioren. Això pot semblar una platitud, però Dunning va dir que, malgrat l’evident que sona, molt poques persones ho fan o ho fan bé.
"Molta gent vol desplegar un sistema o fer alguna acció, i vol que el seu algorisme funcioni perfectament per sempre", va dir Dunning. "Cap algorisme serà una vinyeta màgica. Cap disseny d'interfície d'usuari no s'adhereix per a sempre. No es substituirà mai cap mètode de recollida de dades. Tot això pot ocórrer i succeirà, i les empreses han de mesurar, avaluar i reevaluar de forma vigilant el seu funcionament. el sistema funciona ".
4. Utilitzeu un conjunt d’eines divers
Hi ha desenes d'eines ML disponibles, moltes de les quals podeu utilitzar gratuïtament. Teniu biblioteques de marcs de codi obert populars com ara Caffe, H20, Shogun, TensorFlow i Torch i ML, en diverses obres de Apache Software Foundation (ASF), incloses Mahout, Singa i Spark. A continuació, hi ha opcions basades en subscripcions, incloses Amazon Machine Learning, BigML i Microsoft Azure Machine Learning Studio. Microsoft també té un Toolkit Cognitiu gratuït.
Hi ha infinitat de recursos disponibles. Dunning ha parlat amb nombroses empreses, científics de dades i professionals de la ML, i sempre els pregunta quants marcs i eines diferents utilitzen. Dunning, de mitjana, va dir que la majoria utilitza un mínim de 5-7 eines i sovint molt més.
"No es pot enganxar a una sola eina. Haureu d'utilitzar-ne diverses, i per tant, millor que construïu el vostre sistema de manera agnòstica", va dir Dunning. "Qualsevol que intenti convèncer-te que aquesta eina és l'única que necessitaràs és vendre una factura de mercaderia.
"La setmana que ve podria passar alguna cosa que molesti el carretó de poma, i al ritme d'innovació que estem veient, que continuï succeint durant cinc o deu anys com a mínim", va continuar Dunning. "Mireu un exemple d'aprenentatge barat on potser reutilitzeu un classificador d'imatges existent per analitzar imatges en un catàleg. Això és l'aprenentatge profund amb la visió per ordinador inclosa. Però hi ha eines que ho han empaquetat tot. per mesurar, avaluar i vacilar entre diferents eines, i la vostra infraestructura ha de ser benvinguda per això."
5. Experimenta amb l'aprenentatge híbrid
Dunning va dir que també es pot barrejar aprenentatge barat i profund en un híbrid. Per exemple, si agafeu un model de visió per ordinador existent i torneu a construir les capes principals en què s’està prenent una decisió, podeu cooptar un marc existent per a un cas d’ús completament nou. Dunning apuntava a una competició de Kaggle en la qual els concursants feien exactament això; van agafar un conjunt de dades i van escriure un nou algorisme per ajudar els ordinadors a distingir els gats dels gossos.
"Distingir gats i gossos és una cosa molt subtil per a un algorisme de ML. Penseu en la lògica: els gats tenen orelles punxegudes, però també els pastors alemanys. Els gossos no tenen taques, tret dels dàlmats, etc. Això pot ser força difícil de reconèixer en si mateix ", va dir Dunning. "El tipus que va guanyar va desenvolupar un sistema que ho va fer amb un 99 per cent de precisió. Però em va impressionar més la persona que va arribar a la tercera part. En lloc de construir des de zero, va agafar un programa de reconeixement d'imatges existent d'una altra tasca, va enlairar la va posar alguns exemples, i aviat va ser un 98 per cent exacte per diferenciar els gats dels gossos. Tot el procés va trigar el tipus a tres hores ".
6. Barat no vol dir malament
Malgrat la sobtada connotació, Dunning va dir que l’aprenentatge barat no significa mal aprenentatge. La quantitat de temps que dediqueu a una implementació de ML no es correlaciona directament amb el seu valor empresarial. La qualitat més important, va dir, és assegurar-se que el procés és repetible i fiable. Si l’empresa és capaç d’aconseguir-ho sense invertir una quantitat indeguda de recursos, és millor.
"El barat no vol dir malament. Si funciona, funciona. Si és barat i funciona, això és fantàstic. Però l'esforç que fas per construir no defineix el valor. Això és una fal·làcia cost-cost", va dir Dunning.. "El que defineix el valor és com millora el negoci. Si millora els beneficis o disminueix els costos o millora la vostra situació competitiva. És l'efecte, no l'esforç".
7. No ho anomenis AI
Dunning va subratllar que, quan es parla d’aquestes tècniques, les empreses haurien d’utilitzar la terminologia precisa: ML, visió per ordinador o aprenentatge profund. Tot això tendeix a caure en el terme "intel·ligència artificial", però, per a Dunning, la definició d'AI és simplement "coses que encara no funcionen".
"La millor definició que he escoltat mai per AI és que no són les coses que encara no podem explicar. Totes les coses que no ens hem trobat", va dir Dunning. "Cada cop que treballem alguna cosa, la gent diu" Ah, no és una IA, és només un programari. Només és un motor de regles. Realment és només una regressió logística ". Abans d’explicar alguna cosa, l’anomenem IA, després, sempre l’anomenem d’una altra manera.En molts aspectes, s’utilitza AI com a paraula per a la propera frontera i, en AI, sempre hi haurà una propera frontera. cap a on anem, no cap a on ja hem arribat ".