espera que su base de datos vectorial sin servidor satisfaga la demanda en torno a la IA generativa y al mismo tiempo reduzca los costos y las tareas esenciales de gestión de infraestructura. Sin embargo, los analistas creen que Pinecone Serverless, la base de datos vectorial sin servidor de Pinecone, puede tener pocos interesados. "¿Por qué configurar y administrar una base de datos independiente, incluso si tiene las ventajas de la escalabilidad sin servidor, si puedes tener la misma funcionalidad de la base de datos que ya utilizas y en la que ya gestionamos nuestros datos", pregunta Doug Henschen, analista principal de Investigación de constelaciones. Además de las bases de datos vectoriales como Milvus, Weaviate y Chroma, proveedores de servicios de bases de datos como MongoDB, Couchbase, Snowflake y Google BigQuery, entre otros, ya han agregado o planean agregar capacidades de búsqueda e incrustación de vectores. agregar pronto. "La incorporación de la integración y la búsqueda de vectores no favorece el desarrollo de un mercado emergente de bases de datos de vectores", afirmó Henschen.

Según los expertos, las bases de datos vectoriales y la búsqueda de vectores son dos tecnologías utilizadas por los desarrolladores para convertir información no estructurada en vectores, hoy más comúnmente llamados "incrustaciones". A su vez, estas incorporaciones hacen que almacenar, buscar y comparar información sea más fácil, más rápido y significativamente más escalable para grandes conjuntos de datos. La ventaja de escala de la búsqueda vectorial también le ha permitido ganarse el favor de los desarrolladores que crean aplicaciones basadas en IA generativa. Esto se debe a que cuantos más datos se puedan enviar a un modelo de lenguaje grande (LLM), más respuestas precisas podrá generar el modelo, lo que hará que la aplicación de la capa superior sea más eficiente. Sin embargo, Doug Henschen de Constellation Research no está convencido de que las empresas pagarían por un servicio de base de datos adicional destinado únicamente al desarrollo de aplicaciones basadas en IA, incluso si las bases de datos vectoriales, como la de Pinecone, están repletas de características y funcionalidades para desarrolladores y científicos de datos que trabajan. sobre IA.

El estancamiento de los presupuestos de TI, otro factor desfavorable

Además, el lanzamiento de Pinecone Serverless llega en un momento en el que los presupuestos de TI empresariales siguen estancados. "Aunque hay mucho interés en la IA generativa, los presupuestos aún no aumentan en consecuencia", afirmó Tony Baer, ​​analista principal de dbInsight. "Los presupuestos estancados se pueden atribuir a la inmadurez del campo: todo, desde herramientas hasta modelos básicos y servicios de ejecución, está en su infancia, y aparte de los copilotos y las consultas en lenguaje natural, las empresas todavía están buscando identificar casos de uso ganadores", agregó. Sr. Baer. Al tiempo que impulsa la demanda de IA generativa, Pinecone espera que la nueva base de datos sin servidor ayude a las empresas a reducir los costos y las molestias de administrar la infraestructura. "La reducción de costos es posible separando las tareas de lectura, escritura y almacenamiento", dijo Pinecone, y agregó que la base de datos tiene como objetivo reducir la latencia mediante la adopción de una arquitectura en la que se produce la agrupación de vectores. Presione el almacenamiento “blob” (objeto binario grande).

Según el proveedor, con sus algoritmos de indexación y recuperación, la base de datos puede realizar una búsqueda vectorial rápida y eficiente en memoria desde el almacenamiento de blobs sin sacrificar la calidad de la recuperación. Según Baer, ​​"la nueva indexación de vectores le da a Pinecone una ventaja sobre otras bases de datos operativas y de vectores". Según el analista, Pinecone admite casi una docena de tipos de índices. El atributo sin servidor de la base de datos también es una ventaja. “Debido a su naturaleza RAG (Generación Aumentada de Recuperación), las cargas de trabajo tendrán las características de cualquier carga de trabajo basada en consultas (en términos analíticos), que son propensas a picos. Sin servidores, los clientes deben proporcionar capacidad Just-in-Case 'por si acaso' que a menudo corre el riesgo de no mencionarse”, explicó Baer. La elección de Pinecone de la tecnología sin servidor también tiene otra razón: simplificar un poco las cosas para los desarrolladores, porque ya no necesitarán aprovisionar servidores.