Casa Endavant pensant Apple, google i el camí cap a l'assistent de coneixement

Apple, google i el camí cap a l'assistent de coneixement

Vídeo: WWDC 2020 Special Event Keynote — Apple (De novembre 2024)

Vídeo: WWDC 2020 Special Event Keynote — Apple (De novembre 2024)
Anonim

Veient la nota principal de la Conferència Mundial de Desenvolupadors d'Apple aquesta setmana i de la conferència d'E / S de Google de fa dues setmanes, el que més em va destacar va ser l'esforç que tant empreses com Microsoft han fet per crear sistemes intel·ligents que sàpiguen. tant com sigui possible sobre tu.

Aquests sistemes saben qui ets, on ets, i tota la informació de la pantalla, generalment amb l'objectiu d'actuar com a "assistent personal" que preveu les teves necessitats. Aquest és un objectiu extremadament ambiciós que una d’aquestes empreses sembla comprendre pot ser el següent gran pas en informàtica.

En el cas d’Apple i Google, altres ofertes anunciades a les seves claus poden atraure més atenció o tenir un impacte més visible a curt termini. Google Photos va cridar molt l’atenció; Tant Apple Pay com Android Pay semblen estar a punt de fer-se molt més habituals, i les millores en Android Wear i WatchOS poden suposar una sortida d’aplicacions per a portables. Però el moviment cap a sistemes totals més intel·ligents i més complets pot tenir el major impacte a llarg termini.

Apple, Google i Microsoft provenen des d'un angle diferent. Però semblen convergir en sistemes que tinguin un front-end mòbil que es pot controlar escrivint o per veu, recolzat amb un conjunt de serveis i processos basats en Internet que contenen una gran quantitat de dades sobre tu i que fan inferencies basades en aquestes dades i el que esteu fent.

El camí cap a aquesta convergència ha estat pavimentat per diverses introduccions en els darrers anys. Molts treballen assistents personals des de fa anys, i Siri va ser desenvolupat originalment com a aplicació autònoma per part del spin-off de SRI International. El 2011, Apple va presentar Siri com a "assistent virtual" amb l'iPhone 4s, principalment actuant com a avantguarda de coses com la cerca al web, el clima local i el restaurant. El 2012, Google va introduir Google Now com a part d'Android 4.1 Jelly Bean, que va proporcionar informació sobre una sèrie de "targetes" que responien a preguntes. Amb el pas del temps, això va créixer per proporcionar més informació i cobrir més dominis.

Al principi, vaig pensar que tots dos eren interessants, però el control de veu semblava més un "truc de saló" que una aplicació útil.

Però durant els últims anys, tots dos han millorat a un ritme ràpid. En part, tenir més usuaris va proporcionar a les dues empreses més dades per treballar. Això, combinat amb algoritmes més intel·ligents i una gran quantitat de treballs en el processament del servidor, va donar lloc a sistemes que ara són molt més precisos per entendre el que estàs demanant del que es llançaven. Tots dos poden respondre preguntes en més àmbits. I ara Google Now pot inferir informació, com ara el lloc on es basa la vostra llar i la vostra oficina en funció de les ubicacions típiques.

Microsoft va presentar Cortana l'any passat com a part del llançament de Windows Phone 8.1, descrivint-lo com el primer "ajudant digital" realment personal perquè va comprendre més del que vau fer en altres aplicacions a més de la cerca al web. Podria fer coses com ara recordatoris i entendre qui era important per a vosaltres i qui no, i encara que no hi hagi tants usuaris, sembla que també ha millorat durant els últims anys. Cortana també formarà part de Windows 10 en ordinadors de sobretaula i ordinadors portàtils.

Això ens porta als anuncis més recents, on els tres venedors semblen prestar funcions dels altres i intentar millorar les seves ofertes.

Google Now On Tap

A l'E / S de Google fa un parell de setmanes, el vicepresident sènior de Google, Sundar Pichai, va parlar sobre com la companyia continuava centrant-se en la cerca. Però quan es va referir a les funcions de l'última versió d'Android, el que em va cridar l'atenció va ser el conjunt de noves funcions per a l'assistent personal de Google Now anomenat "Ara en toc".

Pichai va parlar de la inversió de Google en l'aprenentatge profund i l'aprenentatge automàtic, dient que ha ajudat a Google a reduir la taxa d'error de paraula en el seu reconeixement de la veu del 23 per cent al 8 per cent l'any passat.

Google Now ja té algunes funcions contextuals, per exemple, sap on es troba, de manera que pot estimar el temps que trigarà a arribar a casa i pot mostrar-ho a les diverses "targetes" que utilitza per mostrar informació o dins de les notificacions..

Però Aparna Chennapragada, directora de Google Now, va dir que "Ens vam preguntar com podem obtenir respostes ràpides a preguntes ràpides sense sortir de context. Com podem ajudar-vos a fer les coses en els mínims passos possibles?" El resultat, va dir, va ser un servei nou per ajudar-te "en el moment", sense importar el que fessis per telèfon. Es tracta de Now On Tap, i va dir que combina el gràfic de coneixement de Google -la comprensió de més d’1 mil milions d’entitats (com ara equips de bàsquet i benzineres) -amb context i connexions amb altres aplicacions per proporcionar-vos informació de manera proactiva.

En la demostració que va mostrar, va rebre un missatge en una aplicació que li suggeria un restaurant per sopar i li va demanar que recollís la tintoreria. Si premeu i manteniu premuda la tecla d’inici, s’obrí la targeta Google Now i la funció Now on Tap proporciona informació bàsica sobre el restaurant, inclosos enllaços a mapes de navegació, Yelp i OpenTable; també ha establert un recordatori sobre la neteja en sec. Tocant l'enllaç d'OpenTable va obrir l'aplicació, però d'una manera més impressionant la va obrir directament a la pàgina d'aquest restaurant.

La idea és que el sistema operatiu entengui ara el context d’on es troba i què heu estat fent a la resta del dispositiu. Un altre exemple és que si estàs escoltant música, només pots mantenir la tecla de casa i fer una pregunta sobre la cançó. Google Now sabrà quina cançó reprodueix i, a continuació, podrà respondre preguntes al respecte.

"Podeu obtenir informació a l'instant", va dir Chennapragada. "En tots aquests exemples –l’article que esteu llegint, la música que escolteu, el missatge que esteu responent–, la clau és comprendre el context del moment. Una vegada que tingueu aquesta comprensió, és capaç de donar-vos respostes ràpides. per fer preguntes ràpides, us ajudarà a fer les coses allà on esteu al telèfon ".

Apple destaca la intel·ligència

A la seva nota principal de la WWDC de dilluns, Apple va analitzar diversos canvis en l’iOS 9, però es va portar amb el concepte d’intel·ligència.

Craig Federighi, vicepresident sènior d’enginyeria de programari d’Apple, va parlar de convertir Siri en un “assistent proactiu” que pot fer coses com recordar-vos una tasca específica o un enllaç específic en un navegador en un moment particular o quan arribeu a una ubicació determinada.. Per exemple, si rebeu un missatge de text sobre un esdeveniment proper, podeu dir-li a Siri que "em recordi" i entendrà que esteu referint-vos a l'esdeveniment i establiu un recordatori. Pot fer coses com afegir automàticament invitacions en un missatge de text als vostres calendaris.

Pot recordar les aplicacions que acostuma a utilitzar en un moment determinat del dia i presentar-les en una simple icona i ara afegeix "targetes descriptives" que us proporcionen més informació sobre els resultats d'una cerca (que semblava similar en el concepte) a les targetes de Google Now).

I en general només sembla que ha millorat. Federighi va dir que Apple ha experimentat una reducció del 40 per cent de la taxa d’errors en l’últim any fins al 5 per cent. I és més intel·ligent tractar les coses del propi sistema, ara capaç de respondre a les consultes en llenguatge natural com ara "mostra'm fotos de Utah l'agost passat".

El més interessant, ofereix una API de cerca, de manera que pot trobar contingut a les aplicacions. Per exemple, va parlar de poder enllaçar-se profundament amb l’aplicació Airbnb per trobar lloguers disponibles en una determinada zona; o buscar informació sobre receptes en una altra aplicació.

En una demostració, va mostrar una nova pantalla de cerca a la qual feu lliscar directament des de la pantalla d’inici i com el propi sistema fa suggeriments sobre qui potser voldreu contactar, en funció dels vostres contactes més freqüents i dels propers esdeveniments. Va mostrar com es pot "enllaçar profundament" en aplicacions específiques per obtenir més informació. Funcions similars estaven disponibles a Siri.

Una de les coses que Apple va destacar va ser la privadesa, amb Federighi que va dir "Hem pogut aportar intel·ligència durant tota l'experiència a iOS 9, però ho fem de manera que no comprometi la vostra privadesa". Segons el que, certament, va semblar una excavació al model basat en publicitat de Google, va dir que Apple no mina les vostres fotos, correu electrònic, fotos o informació del núvol. Va dir que tota la informació es fa al dispositiu i es queda al dispositiu sota el vostre control i, quan el sistema ha d’enviar informació al núvol per fer cerques o buscar trànsit, ho fa de manera anònima sense que es comparteixin informació amb tercers. "Té el control", va dir.

Plataforma de creueria de Cortana

Podeu argumentar que Microsoft va començar a proporcionar moltes de les funcions d'assistent personal amb el seu assistent Cortana per a Windows Phone. Va ser el primer dels tres grans assistents per intentar actuar com un assistent real, pel que fa a recordacions de programació i per integrar-se més profundament amb algunes de les aplicacions de telèfon.

Cortana també és part de Windows 10 a l'escriptori i el portàtil. Més recentment, Microsoft va anunciar que una versió de Cortana arribaria a telèfons iOS i Android juntament amb una aplicació "Phone Companion" que connecta el vostre PC a Cortana, de manera que pugueu iniciar les tasques en un dispositiu i completar-les en un altre.

Tal com va descriure Joe Belfiore de Microsoft, "Podeu tenir a Cortana que us recordi que recolliu llet la propera vegada que sigueu a la botiga de queviures i el telèfon es despertarà i us sonarà amb el recordatori. Podreu fer un seguiment d'un voleu utilitzant Cortana tant al telèfon com al vostre PC i obteniu les actualitzacions del dispositiu que esteu activant perquè no us perdeu res."

Conclusió

En molts sentits, estem sentint que les tres companyies es col·loquen juntes, especialment en esforços "proactius". Google i Apple van dir que les seves eines serien més "proactives", utilitzant el terme per descriure com volen que els seus ajudants personals apareguin com a mínim com si fossin capaços d'anticipar el que busqueu.

Els tres es centren a connectar-se millor amb les altres aplicacions del vostre sistema, amb Apple i Google anunciant un enfocament en la "vinculació profunda". Concretament, volen enllaçar-se a coses dins d’una aplicació, com ara anar a la pantalla correcta d’OpenTable per reservar una taula. Al servei d'E / S, el vicepresident d'enginyeria d'Android, Dave Burke, va mostrar com Android M té ara millors maneres perquè els enllaços vagin des d'enllaços de correu electrònic o llocs web al lloc adequat d'una aplicació, sense la pantalla de "desambiguació" actual.

El resultat de tot això és un desdibuix de les línies entre el sistema operatiu i les aplicacions que s’executen, per oferir una experiència i sistemes més perfectes que realment en saben molt més.

Tot plegat hauria de ser força útil. Però per diverses raons, tot això també pot fer por. És massa fàcil imaginar la possibilitat d’un mal ús de les dades, ja sigui només per a un màrqueting excessiu o per a invasions reals de privadesa. Tinc curiositat per com abordarà això de cadascuna de les empreses. Em pregunto si una de les raons per les quals Google no ha anomenat el seu servei "assistent personal" és perquè sona una mica apassionant per part d'una empresa el model de negoci principal està orientat a recopilar dades sobre persones i utilitzar-les per orientar-les millor.

També és fàcil exagerar les capacitats d’aquests sistemes. El concepte d'una màquina atrotinable i astuciable pot ser espantós, però no em preocupa que cap d'aquests sistemes desenvolupi una "IA forta" en el sentit de The Terminator 's Skynet o 2001: A Space Odyssey 's HAL en qualsevol moment en un futur proper. Com deia un participant en un recent panell al qual vaig assistir, vaig dir: "Pensa Jarvis, no HAL", parlant sobre l'ajuda d'intel·ligència de vestir usada a les pel·lícules de Iron Man, en contraposició a la màquina assassina del 2001. Durant els propers anys, la pregunta no serà si aquests sistemes són massa intel·ligents, sinó si són prou intel·ligents com per a ser realment útils o bé ens trobarem utilitzant-los només com a front-end per a cerques web.

Per descomptat, el diable es detalla, i realment no sabrem el funcionament de qualsevol dels sistemes fins que no s’enviïn les noves versions. Si bé el reconeixement de veu millora, expandir-lo a nous dominis provoca més reptes. Tampoc tinc clar el bon treball que faran els sistemes en deixar-vos escollir els serveis que voleu utilitzar en oposició a la prestació predeterminada dels serveis propis d'Apple o Google.

Però el concepte global és clar i la utilitat podria ser excel·lent. Si es despleguen correctament, aquests serveis haurien de fer que els nostres dispositius se sentin més senzills d’utilitzar, més intel·ligents i més personalitzats. Tindran reptes i plantejaran algunes inquietuds, però suposo que faran més coses per canviar la manera com interactuem amb els nostres dispositius que qualsevol cosa des de la pantalla tàctil.

Apple, google i el camí cap a l'assistent de coneixement