¿La navegación web tradicional pronto está muerta y enterrada? El último Presentación del operador por Opadai Consideremos que este puede ser el caso, y esto en el futuro muy cercano. El editor de chatgpt tiene así anunció la disponibilidadEn beta por el momento a los usuarios estadounidenses de la versión profesional de su asistente, de un agente capaz de llevar a cabo tareas de navegación automatizadas previamente realizadas por humanos. "Usando su propio navegador, puede consultar una página web e interactuar con ella escribiendo, haciendo clic y desplazando la página", anuncia OpenAI. "Podemos pedirle que se encargue de una amplia variedad de tareas repetitivas vinculadas al navegador, como completar formularios, ordenar carreras e incluso crear memes".
Operai explicó que el operador usa un modelo, llamado agente de uso de computadora (CUA), con las capacidades de visión de GPT4O junto con un razonamiento avanzado gracias al fortalecimiento del aprendizaje. Por lo tanto, este agente se forma para interactuar con las interfaces gráficas del usuario (botones, menús, campos de texto ...) sin requerir API web específicas. "Al combinar la percepción avanzada de la interfaz gráfica con la resolución estructurada de los problemas, puede descomponer las tareas en planes con varias etapas y autocorrigencia de forma adaptativa cuando surgen dificultades", observa OpenAi. Agrega que "esta capacidad marca el siguiente paso en el desarrollo de la IA, al ofrecer modelos para usar las mismas herramientas que las usadas diariamente por los humanos y abriendo la puerta a una amplia gama de nuevas aplicaciones".
Operación del operador de OpenAI. (Crédito: Openai)
Promesas de rendimiento y seguridad
En su explicación de texto, el proveedor también destaca los avances y el rendimiento de su última herramienta en varios puntos de referencia. "Aunque CUA todavía está en sus comienzos y presenta límites, establece resultados de referencia avanzados, logrando una tasa de éxito del 38.1 % en OsWorld para el uso total de una computadora y 58.1 % en Webarena y 87 % en WebVoyer para tareas basadas en la web. Estos resultados destacan la capacidad de navegar y operar en varios entornos", dice Openiai.
El editor dijo que también desarrolló operador colocando seguridad en la parte superior de sus prioridades para enfrentar los desafíos de un agente en el mundo digital. Entonces el sacerdocio o desear ¿piadoso? La participación de la sociedad en este punto, y el CEO de Sam Altman de Operai en persona - En el proyecto de infraestructura monumetal, IA Stargate anunciado por Donald Trump Quien se libera de cualquier regulación y salvaguardas serias de IA, todavía deja una pequeña duda. Operai tampoco es el único que trabaja en la navegación web dopada en AI, este también es el caso de Dia anunciado por ARClo que hace que la seguridad y la privacidad sean un pilar de sus desarrollos.
Otras noticias que te pueden interesar