Google Presentó Gemini 2.0, su último modelo de lenguaje recortado para la creación de agentes y que la compañía describe como el modelo más eficiente hasta la fecha. Anunciado ayer, un primer modelo experimental llamado Flash estará disponible para todos los usuarios. La segunda iteración se presenta como que tiene capacidades multimodales avanzadas, para tratar tareas de entrada/salida de audio multilingües, razonamiento, investigación ... El proveedor establece que Gemini 2.0 facilitará el desarrollo de agentes de IA que se acercan a un asistente universal. Los modelos de agentes pueden incluir más, anticipar varios pasos y tomar medidas en nombre del usuario, bajo supervisión, dijo Sundar Pichai el CEO de Google.
Los avances de Gemini 2.0 se basan en inversiones realizadas durante diez años en un enfoque completo y diferenciado para la innovación de IA, según el gerente. Recuerde, sin embargo, que la firma de la vista de montaña tiene sobre todo ha sido tomado de lecciones por el éxito de ChatGpt Y durante dos años las mordeduras dobles para compensar la demora. La tecnología se basó en equipos personalizados como su trillium de sexta generación TPUS (Unidad de procesamiento de tensor) - Presentado en mayo pasado -, que alimentó el entrenamiento e inferencia de Géminis 2.0. Trillium también está disponible para los clientes que desean usarlo. Con este anuncio, la compañía también presentó la funcionalidad, la investigación profunda, que explota las capacidades de razonamiento avanzado y el largo contexto para actuar como asistente de investigación, al explorar temas complejos y compilar informes. La investigación profunda está disponible en Géminis avanzada.
Comparación del rendimiento según diferentes puntos de referencia de los modelos Gemini 1.5 Flash, Pro y 2.0 Flash. (Crédito: Google)
La búsqueda de IA con el proyecto Mariner
Mientras Gemini 1.0, presentado en diciembre de 2023, tenía como objetivo organizar y comprender la información, Gemini 2.0 tiene como objetivo hacerlo más útil, según el Sr. Pichai. Al alabar los méritos de Géminis 2.0, el proveedor citó el Proyecto Mariner, un prototipo de investigación temprano construido con Gemini 2.0 que explora el futuro de la interacción entre el hombre y el agente, comenzando con un navegador. Como prototipo de investigación, puede comprender y razonar a través de la información de una pantalla de navegador, incluidos píxeles y elementos web como texto, código, imágenes y formularios, luego usar esta información a través de una extensión experimental de Chrome para realizar tareas. Funciones interesantes en el que la compañía de navegador también trabaja con su navegador AI DIA Programado para activar tanto macOS, iOS y Windows y Android.
Otras noticias que te pueden interesar