El sector de la IA generativa está en auge. Después de una ola de inversiones en diferentes start-ups como Microsoft en OpenAI (casi 10 mil millones de dólares), también ha llegado el momento de las adquisiciones. Este es el caso de Ladrillos de datos que acaba de gastar mucho dinero para permitirse MosaicLM, que ofrece una plataforma de capacitación e implementación para lenguajes modelo grandes (LLM).

La operación se estima en 1.300 millones de dólares. MosaicML se fundó en 2021 en San Francisco y ha recaudado poco menos de 34 millones de dólares de inversores como DCVC, AME Cloud Ventures, Frontline, Atlas, Playground Global y Samsung Next, según PitchBook. La joven empresa estaba entonces valorada en 136 millones de dólares. La transacción con Databricks demuestra el interés por esta tecnología, así como la captación de talento.

Integración con la plataforma Lakehouse

MosaicML es conocido por sus LLM llamados MPT. Estos transformadores existen en una versión que comprende 7 mil millones de hiperparámetros (MPT-7B) y una más reciente con 30 mil millones de parámetros (MPT-30B). El acuerdo establece que estos modelos se integrarán en la plataforma Lakehouse de Databricks para construir IA generativa y capacitar LLM. El objetivo es "proporcionar a los clientes una manera rápida y sencilla de mantener el control, la seguridad y la propiedad de sus valiosos datos sin altos costos", dice Databricks.

La firma americana también está presente en la sección LLM con Dolly. Presentado el pasado mes de marzoEste modelo se diferencia del GPT de OpenAI en que no juega con la cantidad de parámetros. Funciona tomando un modelo de código abierto existente de 6 mil millones de parámetros (en comparación con los 175 mil millones de GPT 3.5). Databricks se lanzó posteriormente como código abierto una segunda versión de Dolly con 12 mil millones de parámetros. Para que conste, el nombre Dolly se refiere a la primera oveja clonada, porque es un clon del modelo Alpaca desarrollado por académicos de Stanford, basado a su vez en LLAMA de Meta.