Casa Negocis Google simplifica l’aprenentatge automàtic amb sql

Google simplifica l’aprenentatge automàtic amb sql

Taula de continguts:

Vídeo: ФИШКИ ГУГЛА О КОТОРЫХ ВЫ НЕ ЗНАЛИ | ТОП 30 СЕКРЕТОВ GOOGLE (De novembre 2024)

Vídeo: ФИШКИ ГУГЛА О КОТОРЫХ ВЫ НЕ ЗНАЛИ | ТОП 30 СЕКРЕТОВ GOOGLE (De novembre 2024)
Anonim

Google ara ha afegit les capacitats d'aprenentatge automàtic (ML) a la seva Google BigQuery, l'oferta de bases de dades en núvol a escala de petabyte (PB) de l'empresa. Ja anomenada BigQuery ML, la nova versió us permet utilitzar instruccions de SQL estructuït de consulta (SQL) per crear i desplegar models de ML per a analítiques predictius.

No és només una bona notícia per als científics de dades que utilitzen Google. També és bo per als operadors de negocis interessats en avançar en les seves capacitats d’analítica de dades perquè afegeix un competidor més eficaç a una llista força petita de venedors capaços de proporcionar aquest nivell de sofisticació a través del núvol. Els altres dos noms més coneguts són el servei de bases de dades relacional d'Amazon i el Microsoft Azure SQL, i en podeu trobar més en el nostre recent servei de servei de bases de dades en núvol.

El problema de tots els venedors i compradors de productes de dades ha estat sempre la bretxa de competències. Això ha estat especialment cert per a aquells que estiguin interessats en realitzar analítiques de ML i de predicció, ja que sovint aquestes disciplines requereixen coneixement de noves tecnologies i llenguatges de consulta.

"Per a cadascun dels científics de dades, hi ha centenars d'analistes que treballen amb dades i la majoria utilitzen SQL", va dir a PCMag Sudhir Hasbe, director de Gestió de productes de Google Cloud. Alguna cosa hauria de donar si el poder d’un exèrcit d’analistes de dades s’hauria de desviar del coll d’ampolla creat per massa pocs i massa treballadors científics de dades.

La resposta de Google a aquest dilema no és gens destacable. Tot i que ML és una tendència en calent i es presenta en tot tipus de productes a tot arreu, no deixa de ser el territori dels científics de dades. Molts venedors han aconseguit avançar en la simplificació de la tecnologia, però la lleig veritat és que es pot simplificar molt i encara és massa difícil que utilitzi més del 99 per cent de la població humana. Tot i així, hem de ser capaços d’utilitzar-lo perquè ML pot fer més coses i fer-ho més ràpidament que un grup d’humans super-intel·ligents.

Google està plantant ML dins de Google BigQuery perquè resideixi més a prop de les dades. L’aplicació aportarà funcions de ML més ràpid que els models ML tradicionals en part perquè les analítiques de dades es poden realitzar a l’origen. Ara en versió beta, BigQuery ML permet als analistes (i científics de dades) executar analítiques de predicció com ara predir les vendes i crear segments de clients just a sobre de les dades on s’emmagatzemen. Això només és una respectable i una actualització notable.

Tot i això, Google va anar més enllà que afegint una capacitat que permet als analistes de dades utilitzar instruccions SQL simples per crear i implementar models ML. Ara mateix, les opcions són regressió lineal i models de regressió logística per a anàlisis predictius, ja que són els dos models més utilitzats.

A continuació, es mostra una il·lustració que Google va proporcionar per demostrar com utilitzarien els analistes de dades aquesta capacitat:

Segons Hasbe, Google planeja afegir més opcions de ML a aquesta capacitat. "Hem de sentir als nostres clients quins models volen afegir perquè ens proporcionin els més útils", va dir.

Actualitzacions addicionals de Google BigQuery

A l’interior de la llista substancial d’actualitzacions després de ML es troben una capacitat d’agrupament, BigQuery Geographic Information Systems (BigQuery GIS), un nou connector de dades de Google Sheets i un nou connector de dades de Google Sheets.

El clúster també està en versió beta i permet la creació de taules agrupades en un moviment d'optimització de dades que agrupa files amb claus de clúster similars. Això redueix els costos ja que millora el rendiment i permet a Google BigQuery carregar a l'usuari només per les dades escanejades en lloc de tota la taula o la partició.

Actualment, GIS BigQuery està en fase alfa i s'utilitza per a l'anàlisi de dades geospacials. Mentre que l’equip de Google Cloud es va associar amb Google Earth Engine per crear BigQuery GIS, heu de portar les vostres pròpies dades geospatials a la taula. Això no és un problema a diverses indústries, com ara sistemes de cotxes connectats, Internet of Things (IoT), fabricació, venda al detall, ciutats intel·ligents i telemàtica. Per no parlar dels organismes governamentals que van des de l’Agència de Protecció del Medi Ambient (EPA) i l’Agència Nacional d’Intel·ligència Geospatial fins a l’Administració Nacional Oceànica i Atmosfèrica (NOAA) i totes les branques militars, per descomptat.

BigQuery SIG utilitza la biblioteca S2, que ara té més de mil milions d’usuaris a través d’una varietat de productes com Google Earth Engine i Google Maps. Si necessiteu més dades geospatials, el govern federal comparteix una quantitat immensa de GeoPlatform.

És probable que un nou connector de dades de Google Fulls de Google encantarà molts analistes de dades simplement perquè és tan pràctic per a l'ús diari. Podeu accedir a Google BigQuery des de Google Sheets (programa de full de càlcul) i utilitzar eines de Google Sheets com ara Explore, que és una eina combinada de col·laboració, visualització de dades i consulta de llenguatges naturals.

Google BigQuery també té una nova interfície d'usuari (IU) en versió beta. Un dels elements més interessants és la funcionalitat de visualització d’un clic que és compatible amb Google Data Studio. Tot dit, és una excel·lent roda de millores per a un servei ja elegant. Aquestes actualitzacions es provaran a la propera ronda de les revisions de la solució de bases de dades de base de dades de PCMag (DBaaS) de PCMag, un cop s'hagin esborrat els errors i els productes s'han mogut més enllà dels seus respectius estatges alfa i beta.

PCMag EIC Dan Costa discuteix el futur de les dades:
Google simplifica l’aprenentatge automàtic amb sql