A principios de esta semana, DataStax anunció la incorporación de Schema GPT Translator a su servicio de transmisión de eventos y datos Astra Streaming, disponible desde el año pasado en AWS, Google Cloud Platform (GCP) y Microsoft Azure. Basado en el software de código abierto Apache Pulsar, el servicio gestionado Astra Streaming permite a las empresas alimentar sus aplicaciones con un flujo de datos en tiempo real. Según DataStax, Schema GPT Translator genera automáticamente asignaciones de esquemas, por lo que los desarrolladores pueden centrarse en otros aspectos de la creación de canales de datos en tiempo real y ya no perder tiempo creando manualmente estas asignaciones, una tarea siempre muy tediosa. La creación de asignaciones de esquemas es una parte esencial del desarrollo de procesos de canalización de datos, especialmente para la integración e interoperabilidad de datos entre múltiples sistemas y fuentes. “Por lo general, los sistemas de canalización de datos tienen diferentes enfoques para representar esquemas y definir tipos de datos. Lo que requiere hacer coincidir manualmente los esquemas de una canalización. Pero este proceso es complicado, tedioso y propenso a errores”, escribió Jamie Ferguson, director senior de gestión de productos de DataStax, en una publicación de blog. "Además de la complejidad de crear mapas de esquemas, los mapas de esquemas deben actualizarse cuando los esquemas evolucionan", añadió.

Índice
  1. El fin de los procesos manuales
  2. Búsqueda de vectores

El fin de los procesos manuales

"Para evitar el mapeo manual, Schema GPT Translator captura relaciones contextuales y dependencias en un esquema, y ​​genera mapeos de manera rápida y precisa a otras representaciones de esquema y tipos de datos", explicó la compañía durante el anuncio de la función. "Schema Translator amplía el enfoque de conectar fuentes de datos como bases de datos a aplicaciones y viceversa, desde el mapeo relacional de objetos (ORM) y el soporte de API hasta recomendaciones automatizadas basadas en un modelo de IA generativo", agregó la compañía. "Actualmente, GPT Translator está disponible con Astra DB Sink Connector y puede generar asignaciones para esquemas en Astra Streaming (representados en JSON o Avro) a esquemas de Astra DB (representados en Contextual Query Language), pero se agregarán otros conectores más adelante". Dijo DataStax.

Según Ferguson, uno de los beneficios del Schema GPT Translator es que permite que las asignaciones de esquemas se actualicen rápidamente a medida que los esquemas evolucionan para adaptarse a los cambios en las canalizaciones de transmisión, ya sea debido a nuevas fuentes de datos o después de cambios en los requisitos comerciales. Las empresas que se suscriban a Astra Streaming podrán utilizar Schema GPT Translator sin costo adicional. Astra Streaming ofrece tres niveles de suscripciones, incluido un modelo de pago por uso. El término GPT (Generative Pre-trained Transformer) hace referencia a un modelo de inteligencia artificial basado en técnicas de aprendizaje profundo. Fue popularizado por ChatGPT de OpenAI, aunque la compañía no es la única que lo utiliza y ha lanzado varias versiones de su propio GPT. DataStax aún no ha especificado qué GPT está utilizando.

Búsqueda de vectores

La semana pasada, la compañía dijo que se estaba asociando con Google Cloud para llevar la búsqueda vectorial a AstraDB y hacer que Apache Cassandra sea más compatible con la IA y las cargas de trabajo de modelos de lenguaje grandes (LLM). Construido sobre Apache Cassandra, AstraDB será sin duda uno de los primeros en llevar la búsqueda vectorial a la base de datos distribuida de código abierto. Actualmente, la búsqueda vectorial de Cassandra está prevista para la versión 5.0, según una publicación de la comunidad de bases de datos, de la que DataStax es miembro.