Anteriormente conocido como Azure Cognitive Search, Azure AI Search conecta almacenes de datos externos que contienen datos no indexados con una aplicación que solicita consultas a un índice de búsqueda. El servicio, que consta de un motor de consultas, índices y un motor de indexación, se utiliza principalmente para recuperar información con el fin de mejorar el rendimiento de la IA generativa, un proceso conocido como RAG. Microsoft Acaba de traer una actualización que aumenta algunas cosas como el almacenamiento o el tamaño del índice vectorial.

Sin embargo, el proveedor advierte de algunas limitaciones a la ampliación de la capacidad. “Los límites ampliados solo se aplicarán a los nuevos servicios creados después del 3 de abril de 2024”, afirmó la empresa, y añadió que no hay forma de actualizar los servicios existentes, por lo que las empresas tendrán que crear otros nuevos para beneficiarse de las mayores capacidades. Estos últimos se beneficiarán de un aumento de entre 3 y 6 veces en el almacenamiento total por partición, un aumento de entre 5 y 11 veces en el tamaño del índice vectorial por partición y la capacidad de cómputo adicional que respalda el servicio, que admite vectores de mayor rendimiento y hasta 2 veces la mejora en el rendimiento de indexación y consultas.

Índice
  1. Hasta 500 GB de almacenamiento y 164 GB para índices vectoriales
  2. Más funciones para optimizar el almacenamiento de vectores

Hasta 500 GB de almacenamiento y 164 GB para índices vectoriales

“En promedio, la actualización reducirá el costo por vector en un 85% y ahorrará hasta un 75% de los costos totales de almacenamiento”, dijo Pablo Castro, ingeniero de Azure AI. En una publicación de blogSegún él, el nivel básico del servicio obtendrá 13 GB de almacenamiento adicional por partición después de la actualización, en comparación con los 2 GB por partición anteriores. Los niveles S1, S2 y S3 del servicio obtendrán 135 GB, 250 GB y 500 GB de almacenamiento adicional por partición, respectivamente. Por último, los niveles L1 y L2 no verán ningún cambio, según la empresa.

En términos de tamaño del índice vectorial, los niveles base, S1, S2 y S3 obtendrán 4 GB, 32 GB, 88 GB y 164 GB de capacidad de escalamiento adicional por partición, respectivamente. Nuevamente, L1 y L2 no verán ningún cambio. La oferta actualizada estará disponible en la mayoría de las regiones de los EE. UU. y el Reino Unido, así como en otras regiones como Suiza occidental, Suecia central, Polonia central, Noruega oriental, Corea del Sur, Corea central, Japón oriental y occidental, Italia norte, India central, Jio India occidental, Francia, Europa norte, Canadá central y oriental, Brasil sur, Asia oriental y Sudeste asiático.

Más funciones para optimizar el almacenamiento de vectores

Además de actualizar el almacenamiento de vectores y los tamaños de índice, la empresa está completando funciones adicionales que actualmente se encuentran en vista previa para optimizar el almacenamiento de vectores, incluyendo cuantificación y tipos numéricos restringidos para vectores, entre otras cosas. “Microsoft utiliza cuantificación y sobremuestreo para comprimir y optimizar el almacenamiento de datos vectoriales”, explicó Castro, reduciendo el tamaño del índice vectorial en un 75 por ciento y el almacenamiento de vectores basado en disco en un 25 por ciento.

Además, los expertos dijeron que las empresas pueden utilizar tipos de campos vectoriales primitivos, como int8, int16 o float16, para reducir el tamaño del índice y el almacenamiento en disco de vectores hasta en un 75 por ciento. El servicio también aprovecha otras técnicas de optimización, como la configuración de la propiedad almacenada en campos vectoriales para reducir los costos de almacenamiento.