A principios de semana, varios medios de comunicación informaroncancelación de varios eventos organizados por Google para el lanzamiento de su LLM multimodal, Gemini. Algunos ya vieron un hueco al principio para los primeros pasos del modelo. Pues bien, la firma de Mountain View ha decidido desmentir en parte los rumores. Si no hay eventos, Google lanza oficialmente Gemini hoy, pero solo parcialmente.

Después de enumerar los esfuerzos de la empresa en materia de IA, Sundar Pichai, director ejecutivo de Google y Alphabet, dijo en un comunicado de prensa: "Hoy estamos dando el siguiente paso con Gemini, nuestro modelo más potente y eficiente en general hasta la fecha, que ofrece a la industria -Rendimiento líder en muchas pruebas comparativas. Nuestra primera versión, Gemini 1.0, está optimizada para diferentes tamaños: Ultra, Pro y Nano.

Índice
  1. Gemini Pro y Nano dan sus primeros pasos, Gemini Ultra tarde
  2. Una batalla remota entre Google y OpenAI

Gemini Pro y Nano dan sus primeros pasos, Gemini Ultra tarde

En detalle, Gemini Pro está disponible de inmediato en Bard, El chatbot de Google lanzado a principios de año.. Será accesible únicamente en inglés en 170 países. La empresa planea integrar pronto otros idiomas y países. Para que conste en Francia, Tuvimos que esperar hasta junio para verlo implementado.. La versión nano de Gemini, por su parte, encontrará su lugar en el smartphone Pixel 8 a través de Android 14 con varias funciones como resumen de grabación, respuesta inteligente en Gboard, etc. Finalmente, el editor prevé integrar Gemini en otros servicios como la Búsqueda. , Ads, Chrome y Duet AI en los próximos meses.

A partir del 13 de diciembre, los desarrolladores y clientes comerciales podrán acceder a Gemini Pro a través de la API AI Studio o mediante Vertex AI de Google Cloud. Los desarrolladores de Android podrán utilizar la versión nano del LLM. Finalmente, queda Gemini Ultra, que es la versión detrás de los rumores de retraso. En un comunicado de Google, "actualmente estamos realizando controles exhaustivos sobre la confianza y seguridad del modelo". Y añade: "Haremos que Gemini Ultra esté disponible para clientes, desarrolladores, socios y expertos en seguridad y ética seleccionados para pruebas preliminares". La firma tiene previsto reunirse a principios del próximo año para ver el rendimiento del Gemini Ultra en la versión “Bard Advanced”.

Una batalla remota entre Google y OpenAI

Para que conste, Gemini es un LLM multimodal. Es decir, es capaz de generar texto, imágenes, audio, generar código (Python, Java, C++ y Go). Compite con GPT-4 y la última versión Turbo anunciadas en el primer DevDay de OpenAI. También cabe señalar que en su comunicación Google realizó pruebas comparativas con GPT-4 y no con la versión Turbo más reciente.

Por tanto, la batalla se lanza en la carrera por los LLM multimodales. Google está tratando de aprovechar una pequeña caída en el desempeño de OpenAI después de la crisis de gobernanza y el destino de Sam Altman. Al comienzo de la semana, Axios destacó que el editor retrasaría el lanzamiento de GPT Store hasta 2024 una herramienta de personalización ChatGPT.