En marzo de 2022, Copo de nieve anunció la adquisición de Streamlit por la modesta suma de 800 millones de dólares. Más de un año después de esto adquisiciónLa redacción de Le Monde Informatique se reunió con Adrien Treuille, cofundador y director general de la start-up. Fundada en 2018 en el Área de la Bahía de San Francisco, la startup ha desarrollado un marco que permite a los expertos en aprendizaje automático y científicos de datos compartir su trabajo a través de aplicaciones interactivas. "Fue uno de los marcos de aprendizaje automático de código abierto de más rápido crecimiento en los últimos cinco años", afirma Adrien Treuille, y añade que esta herramienta "es utilizada por más de 150.000 desarrolladores y 1,5 millones de usuarios de aplicaciones en más del 80% de las empresas Fortune 500". empresas a nivel mundial. En pocas palabras, Streamlit proporciona a los especialistas una capa de visualización y una capa de aplicación para su trabajo.

Después de unos años y varias rondas de recaudación de fondos (62 millones de dólares recaudados en cuatro años), el especialista en almacenamiento de datos en la nube se fijó en la joven empresa. “Ahora somos parte de la familia Snowflake. Y lo que es muy interesante es que, para mí y para el deleite de todos, durante los últimos seis meses, esta revolución del LLM se ha producido en gran medida con investigadores de ingeniería que utilizan el streaming tanto dentro como fuera de Snowflake”, continúa Adrien Treuille. Toma así el ejemplo de GPTceroque fue una de las primeras aplicaciones impulsadas por los LLM. Su objetivo es determinar si alguien ha utilizado GPT3, GPT4, Bard u otros modelos de IA para escribir un documento o generar contenido. Para ello, utilizará un modelo de ML para estimar la probabilidad de utilizar una herramienta de IA concreta.

Índice
  1. Se desarrollaron dos versiones de Streamlit, incluida una “nativa de Snowflake”
  2. Una interfaz de chat presentada en la Cumbre
  3. Un ajuste final antes de un lanzamiento general

Se desarrollaron dos versiones de Streamlit, incluida una “nativa de Snowflake”

Para asegurar su desarrollo y llegar al mayor número de usuarios, Streamlit ha asumido el desafío de desarrollar dos versiones de su solución. Uno de ellos es la versión de código abierto. Sigue creciendo muy rápidamente y tiene 1,5 millones de usuarios mensuales. Al mismo tiempo, la empresa ha desarrollado una versión comercial dentro de Snowflake, actualmente en fase de vista previa privada utilizada por alrededor de un centenar de clientes. “Lanzaremos una versión pública más adelante este año”, confirma Adrien Treuille. En efecto, es el mismo producto, pero dentro de Snowflake, lo que significa que los usuarios tienen acceso inmediato a toda la infraestructura del proveedor sin ningún trabajo adicional. “Así que tienes todas tus tablas de datos de Snowflake, todos tus repositorios de documentos para datos no estructurados, y tienes el modelo de seguridad y gobernanza, que es una especie de gran punto de venta de Snowflake: tus datos están seguros, sabes a dónde van, ”, explica el director de la joven empresa.

De hecho, con el gran auge de la IA generativa, muchas empresas que llevaban años trabajando en el tema se encontraron de alguna manera a la vanguardia de un gran número de aplicaciones de LLM, señala Adrien Treuille, sorprendiendo al mundo entero, incluido el equipo de Streamlit. . “Hace apenas dos semanas escribimos un publicación de blog “IA generativa y Streamlit: una combinación perfecta” dice: ¿por qué creemos que está sucediendo esto? Es como si estuviéramos detrás de nuestros propios usuarios”, afirma Adrien Treuille. Mirando hacia atrás en los últimos cinco años, la startup afirma que existen más de 190.000 fragmentos de código Streamlit en GitHub y que todos han ayudado a formar GPT4 y otros LLM. "Esto significa que los analistas, científicos de datos e incluso estudiantes pueden realizar análisis rápidamente, redactar nuevas aplicaciones y entrelazar fragmentos Streamlit generados automáticamente en otras aplicaciones", comenta el CEO. Al mismo tiempo, ya se han creado más de 5.000 aplicaciones Streamlit impulsadas por LLM en su “Community Cloud”. Y estas cifras aumentan rápidamente cada día, asegura.

Hasta la fecha, se han creado más de 5000 aplicaciones Streamlit impulsadas por LLM; aquí hay algunos ejemplos. (Crédito: Streamlit)

Una interfaz de chat presentada en la Cumbre

En cuanto a las últimas innovaciones, Streamlit dice que ha lanzado una interfaz de chat esta semana durante la Cumbre Snowflake. “st.​ chat_message” y “st.​ chat_input” son dos elementos de chat dedicados a crear aplicaciones conversacionales directamente en Streamlit. Aprovechando el lanzamiento de estas herramientas, Adrien Treuille demostró cómo crear un chatbot con tecnología LLM utilizando OpenAI, Snowflake y Streamlit. "La aplicación está íntegramente en Python y es totalmente programable", explica. Los usuarios pueden optar por utilizar datos del mercado de Snowflake o sus propios datos privados almacenados en Snowflake. Entonces la aplicación traduce el lenguaje natural a consultas SQL que puede ejecutar sobre estos datos. “Es como ChatGPT, pero la idea no es traducir poesía persa, por ejemplo. La interfaz no hace un millón de cosas. Lo único que hace es responder preguntas en una base de datos estándar”, comenta Adrien Treuille.

st.​ chat_message” y “st.​ chat_input” son dos elementos de chat dedicados a crear aplicaciones conversacionales disponibles directamente en Streamlit. (Crédito: Streamlit)

Un ajuste final antes de un lanzamiento general

Sin embargo, queda una pregunta: ¿Streamlit es realmente una parte integral de Snowflake? Y si esta pregunta sigue sin respuesta es, en particular, porque el trabajo de integración es sustancial. Hacer que un lenguaje como Python esté más estrechamente integrado con un servicio en la nube no es una tarea fácil y, si bien es positivo para los desarrolladores de Python, genera cargas de trabajo adicionales de Python para Snowflake. En última instancia, el resultado debería ser impresionante: los usuarios podrán gestionar grandes modelos de lenguaje (LLM) y crear aplicaciones basadas en estos modelos sin tener que salir de Snowflake Data Cloud. Y los anuncios hechos en este sentido por la empresa demuestran que se trata de un ajuste final antes de un lanzamiento general importante.

Streamlit se está integrando gradualmente en el panorama de soluciones de Snowflake. (Crédito: Copo de nieve)