El pasado mes de septiembre, Oráculo dio a conocer su estrategia de IA generativa al lanzar el servicio OCI Generative AI en versión beta. Hoy, la firma Redwood Shores anuncia que esta oferta en su nube pública Ahora está disponible para todos con algunos cambios. Entre las mejoras, la solución admite modelos de IA adicionales. Así, alberga el LLM de Meta Llama2 70B (modelo optimizado por la generación de texto en el framework de chat) y también los modelos de Cohere como Command, Summarize e Embed. Están disponibles en modo administrado mediante llamadas API.

Índice
  1. El agente RAG para contextualizar la IA generativa
  2. Un esfuerzo por la personalización
  3. Oracle va por buen camino según los analistas

El agente RAG para contextualizar la IA generativa

Además de los LMM, Oracle ha agregado una variedad de agentes impulsados ​​por IA para ayudar a las empresas a aprovechar al máximo sus datos empresariales mientras utilizan grandes modelos de lenguaje y crean aplicaciones generativas impulsadas por IA. El primero de estos agentes se dedica a la RAG (recuperación de generación aumentada). Esta técnica complementa la generación de texto (LLM) con información de fuentes de datos privadas o propietarias. "Este agente, que funciona como LangChain, combina el poder de los LLM y la búsqueda basada en OCI OpenSearch para proporcionar resultados contextualizados y mejorados con datos empresariales". dijo Vinod Mamtani, vicepresidente de servicios de IA generativa de OCI.

Oracle presentó su agente dedicado a la tecnología RAG. (Crédito de la foto: Oráculo)

En concreto, cuando un usuario lanza una consulta en lenguaje natural en el agente RAG a través de una aplicación empresarial, la solicitud se transmite a OCI OpenSearc. Este último, que es una forma de búsqueda vectorial o semántica, lee y recopila información relevante del repositorio de datos de la empresa. Luego, los resultados de la búsqueda son clasificados por un LLM ReRanker, que pasa la clasificación a un LLM de generación de texto, que responde a la consulta en lenguaje natural. "La información extraída está actualizada, incluso con almacenes de datos dinámicos, y los resultados se proporcionan con referencias a los datos originales", explicó Vinod Mamtani. Las próximas actualizaciones de RAG Agent, que se espera que se publiquen en la primera mitad de 2024, admitirán una gama más amplia de herramientas de búsqueda y agregación de datos y también brindarán acceso a Oracle Database 23c con AI Vector Search y MySQL Heatwave con Vector Store.

Un esfuerzo por la personalización

Otras características, que también estarán disponibles al mismo tiempo, incluyen la capacidad de crear un agente de IA desde la consola OCI. Un usuario podrá crear un bot especificando la tarea que necesita y adjuntándola a una fuente de datos, afirma el gerente. Según Oracle, estos agentes se construyen utilizando el trabajo sobre ReAct publicado por investigadores de la Universidad de Princeton y Google. Desde este marco, son capaces de razonar, actuar y planificar a partir de una serie de pensamientos, acciones y observaciones.

Según Vinod Mamtani, estas capacidades permitirán a los agentes ir más allá de las tareas de búsqueda de información y llamar a API en nombre del usuario, así como automatizar otras. El editor también planea agregar agentes multitarea al servicio a quienes se les puede pedir que conserven la memoria de interacciones pasadas para enriquecer aún más el contexto del modelo y sus respuestas. Según la empresa, la mayoría de estos agentes y sus acciones se pueden agregar a su conjunto de aplicaciones SaaS, incluidas Fusion Cloud Applications Suite, NetSuite y aplicaciones industriales como Cerner. Finalmente, la firma estadounidense presentó una versión beta del servicio AI Quick Actions en OCI Data Science. Esta característica proporciona capacidades de código bajo para acceder a múltiples LLM de código abierto.

Oracle va por buen camino según los analistas

Después de los anuncios, nuestros colegas de IDG pidieron su opinión a los analistas. Ron Westfall, director de investigación de The Futurum Group, dijo: "Oracle puede ofrecer a las empresas un enfoque más ágil para reducir los gastos y los recursos o el tiempo dedicado a la capacitación previa, el ajuste y la capacitación continua de modelos grandes". del lenguaje (LLM) en los conocimientos o datos de una empresa, lo que ha demostrado ser una barrera en muchos entornos empresariales actuales, con la excepción de algunos centros de llamadas y aplicaciones de soporte. 'experiencia del cliente'.

Por su parte, Bradley Shimmin, analista jefe de la firma de investigación Omdia, cree que la firma está “tratando de integrar elementos fundamentales de la IA generativa en sus ofertas principales, en particular las bases de datos, para optimizar los recursos informáticos y reducir los costos. También señala que "una cosa es construir una canalización básica de recuperación y generación aumentada (RAG) capaz de indexar algunos archivos PDF para admitir un LLM de un solo usuario, y otra completamente diferente es implementar implementa RAG para petabytes de empresas en constante evolución". datos y brindar información valiosa a partir de esos datos al público en menos de un milisegundo”. Pero Andy Thurai, analista principal de Constellation Research, es un poco más crítico y dice que Oracle está "muy por detrás" de sus rivales en comparación con las ofertas generales de IA generativa "la opción de Oracle de proporcionar un servicio alojado según sea necesario compite con". "La oferta de AWS, mucho más poderosa, que tiene más opciones y características que la oferta de OCI", observa. Si bien señala que Oracle carece de LLM en su catálogo y su uso es limitado en comparación con la competencia.