Difícil de seguir la estrategia deOpadai En nombre de sus modelos GPT. La compañía lanzó recientemente GPT-4.5pero acaba de presentar la versión 4.1 de su modelo. Disponible en varias versiones (Standard, Mini y Nano), solo serán accesibles a través de la API y quieren ser más rápidos, económicos y eficientes. Según la compañía, estos modelos "sobresalen en las tareas de codificación y el monitoreo de las instrucciones" y exceden GPT-4O y su mini versión "en todos los niveles". Algunas de estas mejoras ya se han integrado en la última versión de GPT-4O, otras están por venir.
Paralelamente, Openai anunció el final del modelo de vista previa GPT-4.5, que se retirará de la API el 14 de julio de 2025. GPT-4.1 ahora se presenta como su sucesor natural, ofreciendo un mejor rendimiento a un costo reducido.
Capacidad de tratamiento reforzado
Los modelos se benefician de una ventana de contexto se extendieron a un millón de tokens, contra 128,000 para GPT-4O, y una mejor comprensión de los contextos largos. Por lo tanto, abordan la propuesta de Géminis por Google. El límite de salida va de 16,385 a 32,767 tokens. Operai afirma haber colaborado estrechamente con su comunidad de desarrolladores para refinar estos modelos de acuerdo con sus necesidades. Por ejemplo, el puntaje en el banco SWE verificado de referencia verificado se mejoró en un 21,4 % en comparación con GPT-4O.
Resumen de las ventajas de las tres versiones de GPT-4.1
Las versiones Mini y Nano se destacan por su eficiencia y bajo costo. Por lo tanto, el Mini modelo ofrecería una latencia reducida a la mitad en comparación con GPT -4O y una caída en los costos del 83 %, al tiempo que mantiene un alto rendimiento. En cuanto al Nano, el modelo más rápido y económico, OpenAI especifica que es "ideal para tareas como la clasificación o la auto -compulsoría". Estos modelos también se integran más fácilmente en herramientas como las respuestas de la API, facilitando la creación de agentes más autónomos capaces de procesar documentos complejos o responder a las solicitudes de los clientes con un mínimo de intervención humana.
Ganancias concretas en tareas complejas
Las ganancias de rendimiento también se observan en tareas técnicas avanzadas. La compañía dice que GPT-4.1 es más efectivo que GPT-4O para resolver el código de forma independiente, desarrollar interfaces front-end, realizar cambios específicos, seguir formatos de difusión o usar herramientas de manera consistente.
Estos avances van acompañados de una caída en el costo: reducción del 26 % en el costo promedio por solicitud, 75 % de descuento en el caché rápido (contra el 50 % antes), sin costo adicional para consultas largas y un descuento del 50 % para los usuarios del lote de la API.
Los analistas se preguntan
A pesar de los ambiciosos anuncios, algunos expertos requieren precaución. Justin St-Maurice, asesor técnico de Info-Tech Research Group, expresa dudas sobre la eficiencia, los precios y la escala de los nuevos modelos. "Este anuncio ciertamente plantea preguntas", dijo. Según él, "si la reducción del 83 % de los costos es real, sería un punto de inflexión, especialmente para las grandes empresas y proveedores de la nube que examinan de cerca el valor por vatio". Pero mata: "OpenAi no especifica claramente qué modelo se refiere la comparación.» »
A pesar de los descuentos anunciados, Justin St-Maurice considera GPT-4.1 como una solución de alta gama, aunque está en línea con las tendencias actuales en los servidores MCP (protocolo de contexto del modelo) y los sistemas para los agentes. Explica que "el tratamiento de un millón de tokens permite flujos de trabajo complejos y razonamiento de tiempo real, pero a $ 2 por millón de tokens como titular y $ 8 en la salida, esto sigue siendo costoso, especialmente frente a alternativas como la llama.
Otras noticias que te pueden interesar