Vídeo: El pla de plans de la Comunicació Local (De novembre 2024)
Les empreses no aconsegueixen cap punt sobre la eficiència de la seva infraestructura o el nivell elevat que poden apilar tot el Big Data que recopilen. El que compta és la qualitat de l’analítica i la intel·ligència que produeixen les dades.
Durant els últims anys, Hadoop és la paraula que ha esdevingut més sinònim de ingerir, processar i transformar dades. Aquest marc de codi obert per a l'emmagatzematge i el tractament de dades distribuïts ha generat un espai empresarial propi i s'ha integrat a totes les plataformes de núvols importants. Hadoop està lluny de l’única tecnologia Big Data que val la pena parlar, però s’ha convertit en la que es basen moltes altres.
El problema de les empreses és que l’espai Hadoop està ple de distribucions i opcions d’eines, i tal com va explicar el director de recerca de Gartner, Nick Heudecker, moltes d’elles semblen iguals. Heudecker, la investigació de la qual abasta la gestió de la informació, inclosos els espais Big Data i NoSQL, va dir que si esteu buscant les opcions generals de processament de dades, molts venedors ofereixen funcions molt similars.
Trencar el mercat
Hi ha tres principals startups de Hadoop de pur joc (Cloudera, Hortonworks i MapR), i totes han crescut constantment el 2015. Segons Gartner, cadascuna té aproximadament 700 clients, donen o agafen el 10 per cent, situant el mercat global entre 2.100-2.400 clients Hadoop a tot el món. Tots tres ofereixen tant un nivell gratuït com un nivell empresarial de la seva distribució Hadoop, i cadascun fa aportacions importants de codi obert a projectes sota la bandera Apache Software Foundation (ASF).
"Les nostres dades indiquen que el 44 per cent de l'ús d'Hadoop actualment no es paga", va dir Heudecker. "Hi ha un líder clar? No ho crec. Tots ells agafen una quota de mercat perquè és un espai molt nou."
En els darrers mesos, bona part de la competència entre els tres s’ha reduït a la competència per les capacitats d’analítica de dades i les formes creatives d’integrar Apache Spark, un motor de processament de dades obert Big Data de codi obert amb casos d’ús des de fluxos de dades en temps real fins a l’aprenentatge automàtic. MapR ha anunciat recentment MapR Streams com a part d'una "plataforma de dades convergent" que integra Hadoop, processament de fluxos basats en Spark i analítica. Hortonworks va desenvolupar una actualització a la plataforma de dades d’Hortonworks (HDP) amb analítica Spark a la memòria i Cloudera ofereix una gran varietat d’integracions de codi obert Spark a través de la One Platform Initiative, juntament amb classes de formació de Spark.
"Hi ha molts esdeveniments en els espais de gestió de la informació i en infraestructures d'informació, i no tot és Hadoop", va explicar Heudecker. "Hi ha un impuls important darrere del model de processament de dades centrat en la velocitat i la memòria de Spark, tot i que el desenvolupament de Spark encara es troba en les seves primeres etapes. Spark serà una altra lingua franca en el processament de dades, com SQL, i definitivament mostra signes que té algunes potes. ja que cada cop hi ha més empreses que hi inverteixen ".
Heudecker també va destacar la importància dels jugadors del núvol en Big Data; els gegants tecnològics que han integrat Hadoop i altres tecnologies Big Data en les seves ofertes d’Infraestructura com a servei (IaaS) existents.
Amazon Web Services (AWS) utilitza el servei Amazon Elastic MapReduce (EMR) per a l’orquestració Hadoop basada en núvol. Microsoft ofereix tota una sèrie de serveis Big Data dins de la seva plataforma de núvols d'Azure, associant-se amb Hortonworks en el seu servei HDInsight per gestionar Apache Hadoop, Spark, HBase i Storm, juntament amb el seu Azure Data Lake i Azure Data Analytics basat en SQL. IBM disposa tant de la seva plataforma local Open Open per a Hadoop com per a IBM BigInsights, un paquet d’analítica que s’executa al seu costat, juntament amb Hadoop i Apache Spark-as-a-service gestionats al seu núvol Bluemix. La llista continua i les empreses troben els casos d’ús més aplicables al núvol.
"Estimem que AWS només té uns 5.000 clients, de manera que és més del doble de la base de clients del joc de pures jugades", va dir Heudecker. "Un dels avantatges de moure't al núvol és que obteniu un ecosistema. Podeu obtenir les distribucions Hadoop de reproducció pura en qualsevol de les ofertes IaaS. MapR està disponible a tots els núvols en els quals pugueu pensar, a part d'IBM; igual. per Cloudera i Hortonworks. No hem vist que la disponibilitat de núvol es converteixi en un factor massa important a l’hora de triar entre un venedor i un altre."
Elecció d'una estratègia de dades empresarials
Per a les empreses petites i mitjanes empreses (SMB) i les empreses en creixement, a l’hora d’invertir en solucions d’analítica i de processament de dades, Heudecker va dir que el factor decisiu és quina plataforma pot oferir el màxim nivell de servei. Segons Gartner, el repte més important per a les empreses és el desfasament en habilitats: esbrinar qui dirigirà la plataforma un cop s'hagi instal·lat i desplegat.
"Si les empreses busquen un soci de la plataforma de dades, qui els ajudarà a ingerir dades? Qui els ajudarà a construir l'aplicació analítica? Quant als tres Hadoop-ers de joc pur, els criteris d'avaluació solen estar al voltant de la maduresa de les eines i consoles de gestió, de les eines de govern de dades i del rendiment."
L’altre aspecte interessant de l’elecció d’una plataforma Hadoop és la manca de lleialtat. Les empreses reavaluen la seva plataforma Hadoop cada 6-12 mesos per comprovar si els components de processament de dades segueixen en forma adequada, a causa de la rapidesa que canvia l’espai i de la poca diferència dels grans jugadors. Heudecker va dir que el 20 per cent de les empreses de les quals parla ha tingut diverses distribucions Hadoop funcionant als seus centres de dades o al núvol, ja que permeten a diferents equips triar la seva plataforma d’elecció o diversificar-se intencionadament per evitar quedar-se enganxats amb una única distribució Hadoop.
Aquest tipus de cartera de plataformes diversificades s’incorpora a allò que Frank Buytendijk, vicepresident i analista distingit de la recerca de Gartner centrat en l’estratègia digital, anomena “informació com a actiu”. Com que no podeu dirigir una empresa sense capital, mà d’obra, materials i instal·lacions físiques o virtuals, Buytendijk va dir que no podeu dirigir un negoci sense informació.
"Ens fixàvem en els negocis en termes dels tres fluxos: el flux primari era de mercaderies, el flux secundari era diners, i el flux terciari era informació per assegurar-nos que els béns i els diners estaven alineats. Ara, a la majoria de negocis és al revés. El flux principal és informació, des de la identificació i la configuració fins al màrqueting de continguts, etc. Tant si es tracta que Big Data no importa realment."
"Big Data" està obsoleta
Buytendjik va dir que no veu la Big Data com una tecnologia independent per a les empreses, sinó com un tema o mentalitat dins de la seva estratègia digital general.
"No crec que tingui una estratègia de Big Data", va dir Buytendjik. "Amb prou feines hi ha una estratègia empresarial sense components digitals, així que crec en tenir una estratègia digital en la qual tot tipus de tecnologies proporcionin capacitats crítiques. Això inclou mòbils, socials, núvols, IoT, màquines intel·ligents i Big Data."
Heudecker creu que comencem a parlar de "Big Data" cada cop menys, perquè ara només són dades. És la manera de fer negocis. Volums massius i alta velocitat de dades ja no són tan desconcertants.
"Big Data es torna a subsumir per informació i analítica", va dir Heudecker. "La categoria Big Data no és francament diferent. Sempre ens demanen la mida del mercat Big Data, però què vol dir això? Big Data no és realment un mercat, és un concepte. Per a una empresa, pensar en Big Data com Una cosa única i especial que és radicalment diferent a la que heu fet abans és un error. En aquest moment, les dades són normalment ".