“Hoy presentamos la disponibilidad de Llama 2, la última generación de nuestro gran modelo de lenguaje de código abierto. […] gratuito para investigación y uso comercial”. Compitiendo con el modelo de lenguaje GPT-4 de OpenAI, esta segunda versión del modelo Meta se presentó junto con el anuncio de una asociación con Microsoft. Con este acuerdo, el mensaje no puede ser más claro: convertirse en el gran modelo lingüístico de referencia. Precisamente por este motivo Meta ha optado por un “enfoque abierto” que considera “bueno para el desarrollo de los modelos de IA actuales, en particular aquellos en el espacio generativo donde la tecnología avanza rápidamente”.

“Al brindar a las empresas, nuevas empresas, emprendedores e investigadores acceso a herramientas desarrolladas a escala, con el apoyo de potencia informática a la que de otro modo no tendrían acceso, abrimos un mundo de oportunidades para experimentar, innovar y, en última instancia, obtener beneficios económicos y beneficios sociales”, especifica la firma en un comunicado. Meta continúa indicando que sus equipos monitorearán cuidadosamente los usos que se hagan de Llama 2 para “aprender lecciones, mejorar estas herramientas y corregir vulnerabilidades”. Una mirada retrospectiva al éxito de Llama 1 En la comunidad de investigadores, con más de 100.000 solicitudes de acceso al modelo de lenguaje grande, Meta indica que su sucesor está listo. Por lo tanto, esta segunda versión incluye pesos de modelo y código de inicio para modelos de lenguaje Llama previamente entrenados y ajustados, que van desde 7 mil millones a 70 mil millones de hiperparámetros.

Índice
  1. Microsoft: un pie en cada campo
  2. Un énfasis en la seguridad para evitar la deriva del modelo

Microsoft: un pie en cada campo

Si hay una empresa que se está beneficiando de este entusiasmo en torno a la IA generativa y los grandes modelos de lenguaje, esa es Microsoft. Durante su conferencia Inspire, su director ejecutivo, Satya Nadella, anunció que quería dar un paso adelante haciendo de Microsoft un socio preferido para Llama 2 y desarrollando sus esfuerzos en el campo de la IA generativa. Inversor desde hace mucho tiempo en OpenAI a quien le debemos ChatGPT, la firma hoy estrecha un poco más sus vínculos con Meta. A partir de hoy, Llama 2 está disponible en el catálogo de plantillas de Azure AI, lo que brinda a los desarrolladores que utilizan la plataforma en la nube los medios para construir con esta plantilla y aprovechar las herramientas nativas de la nube para el filtrado de contenido y las funciones de seguridad. Tenga en cuenta que su competidor, GPT-4, también recibió capacitación en instancias de Azure AI, como explica OpenAI: "La infraestructura optimizada para AI de Azure también nos permite proporcionar GPT-4 a usuarios de todo el mundo".

También está optimizado para ejecutarse localmente en Windows, lo que brinda a los desarrolladores un flujo de trabajo fluido al brindar experiencias generativas de IA a sus clientes a través de diferentes plataformas. Llama 2 está disponible a través de Amazon Web Services (AWS), abrazando la cara y otros proveedores. Después de introducir un ecosistema abierto para marcos de IA intercambiables y ser coautores de artículos de investigación para avanzar en el estado del arte en IA, las dos empresas de TI colaboraron notablemente en la adopción de PyTorch, el marco de IA líder creado por Meta y AI. comunidad - en Azure. Microsoft y Meta ahora están uniendo fuerzas para un enfoque abierto a grandes modelos de lenguaje.

Los modelos preentrenados de Llama 2 se entrenan con 2 billones de tokens y tienen el doble de longitud de contexto que Llama 1. Sus modelos ajustados se han entrenado con más de un millón de anotaciones humanas. (Crédito: Meta)

Un énfasis en la seguridad para evitar la deriva del modelo

"Estamos comprometidos a construir de manera responsable y estamos brindando una serie de recursos para ayudar a quienes usan Llama 2 a hacer lo mismo". Un compromiso que implica diferentes ejercicios en un pequeño equipo. Así, los modelos refinados fueron sometidos a pruebas de seguridad por parte de equipos internos y externos. El equipo trabajó en la creación de consultas contradictorias para facilitar el ajuste de los modelos. Además, se pidió a terceros que realizaran pruebas adversas externas de sus modelos para identificar brechas de desempeño. “Estos procesos de ajuste de seguridad son iterativos; "Continuaremos invirtiendo en seguridad a través de ajustes y evaluaciones comparativas y planeamos lanzar modelos actualizados y refinados basados ​​en estos esfuerzos", dijo Meta.

También se ha publicado un plan de transparencia. Este último, disponible en el artículo de investigación, revela los desafíos y problemas conocidos encontrados y proporciona información sobre las medidas de mitigación adoptadas y aquellas que las dos empresas pretenden explorar en el futuro. Finalmente, se ha creado una Guía de uso responsable para ayudar a los desarrolladores a aplicar las mejores prácticas para el desarrollo responsable y la evaluación de la seguridad. Describe las mejores prácticas que reflejan investigaciones actuales y de vanguardia sobre IA generativa responsable. Esto viene con una política de uso aceptable. Este último prohíbe ciertos casos de uso para garantizar que estos modelos se utilicen de manera justa y responsable.