Databricks, proveedor de una plataforma de gestión de big data basada en el motor Apache Spark, está ampliando su oferta. De hecho, la editorial ha anunciado una versión de su casa del lago dedicada al sector industrial y manufacturero. Con este lanzamiento, Ladrillos de datos espera sorprender a sus competidores en este ámbito. A diferencia de los lagos de datos y los almacenes de datos que almacenan datos respectivamente en formato nativo y estructurado (a menudo SQL), la arquitectura de datos de los lakehouses, popularizada por el propio Databricks, proporciona capacidades adicionales. Este servicio, denominado Databricks Lakehouse para fabricación, proporciona capacidades de mantenimiento predictivo, gemelos digitales, optimización de la cadena de suministro, previsión de la demanda, análisis de IoT en tiempo real, visión por computadora e inteligencia artificial, así como herramientas de intercambio y gobernanza de datos.
Lakehouse para fabricación incluye acceso a aceleradores de casos de uso empaquetados capaces de iniciar un proceso analítico y proporcionar un modelo para ayudar a las empresas a resolver desafíos industriales críticos y de alto valor, dijo Databricks. en un comunicado de prensa. Para facilitar el uso de esta casa en el lago dedicada al sector manufacturero, el editor ofrece servicios y herramientas respaldados por socios, reunidos bajo el nombre Brickbuilder Solutions. Por ejemplo, servicios de migración de bases de datos, gestión e inteligencia de datos, gestión del crecimiento de ingresos, servicios financieros y migración de datos a la nube. Entre los socios del editor para esta oferta se encuentran Accenture, Avanade, L&T Mindtree, Wipro, Infosys, Capgemini, Deloitte, Tredence, Lovelytics y Cognizant. Databricks Lakehouse for Manufacturing ha sido adoptado por empresas como DuPont, Honeywell, Rolls-Royce, Shell y Tata Steel.
Ayudando a los administradores de datos
Según Carl Olofson, vicepresidente de investigación de IDC, se espera que Lakehouse for Manufacturing de Databricks tenga un impacto positivo en los administradores o ingenieros de datos. "Con la oferta de Lakehouse, los administradores de datos podrán coordinar fácilmente los datos entre los entornos del lago de datos y del almacén de datos, garantizando la coherencia, puntualidad y confiabilidad de los datos", dijo Olofson. Otros analistas creen que esta oferta también ayudará a los equipos de científicos de datos de las empresas. "Podrán disponer de análisis preconfigurados desde el primer momento en lugar de empezar desde cero", afirmó Tony Baer, analista principal de dbInsights. En comparación con otras ofertas de la competencia, Databricks está mejor posicionado para proporcionar capacidades avanzadas de ciencia de datos, según Doug Henschen, analista principal de Constellation Research. "Esto es muy evidente con Databricks Lakehouse for Manufacturing, que incluye soporte para gemelos digitales, mantenimiento predictivo, previsión de la demanda y visión por computadora", dijo Henschen.
Acelere la adopción del lago de datos
Olofson dijo que la oferta Lakehouse for Manufacturing de Databricks tiene como objetivo acelerar la adopción de las ofertas Lakehouse de la compañía y aumentar la adopción de otros servicios. “Lakehouse sigue siendo un concepto nuevo y algo amorfo. A Databricks le gustaría acelerar la adopción ofreciendo servicios de hosting específicos de la industria. "Es como 'kits de inicio', porque los elementos centrales de cualquier Lakehouse son específicos de los datos que tiene la empresa y cómo deben combinarse", dijo Olofson. Según Olofson, el suministro de estos kits, o lo que IBM llamaba anteriormente "plantillas", pretende estimular el uso de las bases de datos ofreciendo a las empresas un conjunto de funcionalidades parciales que los usuarios pueden completar con definiciones y reglas específicas de la empresa. “Este es un enfoque muy conocido en software cuando se intenta vender productos complejos o multifuncionales, porque los clientes a menudo no saben cómo empezar. Si Databricks puede atraer clientes con estas ofertas de almacén, podrían beneficiarse de un cierto nivel de lealtad a cambio”, añadió Olofson.
Según Henschen de Constellation Research, al lanzar almacenes específicos de la industria, Databricks consideró varias prioridades internas, como analizar qué industrias podrían tener el mayor potencial para sus ofertas y analizar la demanda de sectores específicos. "Databricks lanzó un Lakehouse para la fabricación después de introducir ofertas similares para el comercio minorista, servicios financieros, atención médica y ciencias biológicas, y medios y entretenimiento el año pasado", explicó Henschen. "El lanzamiento de la oferta específica de la industria pretende ser un incentivo, y la adición de características como modelos analíticos predefinidos puede alentar a las empresas a adoptar el enfoque de Lakehouse y embarcarse en la aventura", dijo Baer de dbInsights.
Ladrillos de datos versus copo de nieve
Los expertos dicen que Databricks, que compite con Snowflake, Starburst, Dremio, Google Cloud, AWS, Oracle y HPE, ha hecho que sus anuncios de centros de datos específicos de la industria le brinden una ventaja competitiva sobre Snowflake. "Los anuncios son muy similares a Snowflake y existe un deseo de competencia en el calendario de anuncios", dijo Henschen. Según él, Snowflake podría tener una ventaja, ya que sus anuncios de nube industrial datan de 2021 con ofertas de nube para medios y servicios financieros. Sin embargo, observa una diferencia en el enfoque de comunicación entre las ofertas de productos de Snowflake y Databricks. Snowflake no utiliza el término "lakehouse" en sus documentos, aunque dice que admite cargas de trabajo de lagos de datos. "Su tecnología se basa en un sistema de gestión de bases de datos relacionales (RDBMS) basado en la nube, con extensiones que admiten datos semiestructurados y no estructurados, así como datos en formatos de soluciones de almacenamiento comunes como Apache Iceberg", dijo Olofson, y agregó que Snowflake también Ofrece configuraciones específicas de la industria.
De todos modos, los analistas creen que es demasiado pronto para evaluar cualquier cambio en la evolución del mercado para estas ofertas específicas de la industria. “Aún es pronto para que estas empresas combinadas estilo lago sustituyan a las empresas existentes. "Los clientes de Databricks pueden estar ejecutando más cargas de trabajo analíticas de SQL en Databricks que en el pasado, pero no creo que sustituya a los titulares en el soporte de cargas de trabajo de misión crítica a gran escala", afirmó. dijo el señor Henschen. “Del mismo modo, Snowflake Snowpark se encuentra en sus primeras etapas y no creo que los clientes elijan Snowflake como plataforma para satisfacer sus necesidades de ciencia de datos. Para cada necesidad, gana el mejor”, añadió Henschen.
Otras noticias que te pueden interesar