Creado en 2021 por Donpaul Stephens (CEO), uno de los dos fundadores de Violin Memory, Matt Youill (director de análisis), un especialista en bases de datos que anteriormente trabajaba en Betfaire.com, y Chia-Lin Wu (responsable del almacenamiento de objetos), una ex empleada de AOL, AirMettle pretende revolucionar el panorama del big data con Analytical Storage, una plataforma de almacenamiento y análisis de datos (estructurados, semiestructurados y no estructurados) compatible con S3 llamada . Este proyecto, aún en desarrollo, cuenta con el apoyo de organizaciones públicas, universidades y entidades de investigación como Carnegie Mellon, Los Alamos National Labs, la National Science Foundation NOAA y la Universidad de Chicago. Al igual que el difunto Igneous (primera era), StorageX, Yellowbrick Data o incluso Databricks y Snowflake, la solución de AirMettle trastoca el paradigma analítico tradicional al integrar capacidades de procesamiento paralelo directamente en su plataforma de almacenamiento de objetos. En lugar de trasladar los datos a servidores, AirMettle aporta potencia de cálculo a los datos, lo que permite realizar el procesamiento analítico in situ, dentro de la propia capa de almacenamiento, y reduce parte de los costes asignados a la infraestructura. Según explica la start-up, el valor añadido consiste en reducir el tráfico de red hacia el conjunto de resultados de la consulta en lugar de hacia el conjunto de datos.

Con AirMettle, todo el proceso analítico se lleva a cabo dentro de la capa de almacenamiento, lo que elimina la necesidad de mover datos y permite tiempos de respuesta más rápidos. (Crédito SL)

Y para evitar silos, conjuntos de datos parciales e indexación limitada, la solución de la startup aprovecha un modelo horizontal con un sofisticado sistema de gestión y partición de metadatos. Tras la ingesta, los objetos (documentos, imágenes, vídeos, etc.) se segmentan de forma transparente en componentes lógicos, y cada objeto se etiqueta con su propio conjunto de metadatos. Estos metadatos permiten a AirMettle realizar una amplia gama de operaciones analíticas, como selección, agregación y formato, en paralelo en estos segmentos, sin necesidad de mover o duplicar datos. Los datos se pasan a los sistemas de análisis sin tener que pasar por una herramienta ETL para alimentar un almacén de datos, que luego se utiliza como fuente de datos para los análisis. La plataforma de AirMettle realiza inherentemente el ETL internamente. La idea es abandonar el concepto de almacén de datos para impulsar el procesamiento analítico con una plataforma, que se ejecuta en las instalaciones o en la nube, capaz de acelerar una amplia variedad de cargas de trabajo analíticas, a saber, consultas SQL, análisis multidimensionales e incluso el procesamiento de datos no estructurados como imágenes, sonidos y vídeos, con capacidades de IA.

La capa de almacenamiento de objetos aprovecha una interfaz compatible con S3 con codificación de borrado y replicación para garantizar la integridad de los datos almacenados en los clústeres. (Crédito SL)

Si bien AirMeetle aún no ha comenzado a comercializar su software, ya cuenta con clientes que pagan, como Los Alamos Labs y la Administración Nacional Oceánica y Atmosférica de los Estados Unidos. Durante una gira de prensa de TI en enero en SF, el director ejecutivo nos explicó que AirMeetle está en conversaciones con operadores de telecomunicaciones para casos de uso como el procesamiento de video, así como la selección y reescalado de datos meteorológicos.