Claude 3.5 sugiere que la inminente omnipresencia de la IA podría ser algo bueno | Tecnología

hace 11 meses

tLa frontera de la inteligencia artificial acaba de ampliarse un poco más. El viernes, Anthropic, el laboratorio de inteligencia artificial fundado por un equipo de empleados descontentos de OpenAI, lanzó la última versión de su Claude LLM. De Bloomberg:

La compañía dijo el jueves que el nuevo modelo -la tecnología detrás de su popular chatbot Claude- es dos veces más rápido que su versión anterior, más potente. Anthropic dijo en sus calificaciones que el modelo supera a competidores importantes como OpenAI en varias capacidades de inteligencia clave, como codificación y razonamiento basado en texto.

Anthropic solo lanzó la versión anterior de Claude, 3.0, en marzo. Este último modelo se ha llamado 3.5 y actualmente solo existe en la iteración mediana "Sonnet" de la compañía. Su versión más rápida, más barata y más tonta, "Haiku", llegará pronto, dice, al igual que su "Opus", más lento, más caro pero más capaz.

Pero incluso antes de que llegara Opus, Anthropic afirma tener la mejor IA del mercado. En una serie de comparaciones directas publicadas en su blog, 3.5 Sonnet superó al último modelo de OpenAI, GPT-4o, en tareas que incluyen pruebas de matemáticas, comprensión lectora y conocimientos universitarios. No fue una victoria clara, ya que GPT mantuvo el liderazgo en algunos puntos de referencia, pero fue suficiente para justificar la afirmación de la compañía de estar a la vanguardia de lo que es posible.

En términos más cualitativos, la IA también parece un paso adelante. Antrópico dice:

Muestra una marcada mejora en la captación de matices, humor e instrucciones complejas y es excepcional en la redacción de contenido de alta calidad con un tono natural y atractivo.

Están corrigiendo su tarea, pero la descripción coincide con los cambios que noté. Independientemente de los parámetros técnicos, una conversación con la última versión de Claude es más placentera que cualquier otro sistema de inteligencia artificial que haya usado hasta ahora.

Sin embargo, la empresa no se limita a vender la actualización en términos de potencia. En cambio, en una medida favorecida por los competidores menos favorecidos en todo el mundo, Anthropic se está centrando tanto en el costo como en la capacidad. Claude 3.5 no sólo es más inteligente que el antiguo sistema, afirma la empresa, sino que también es más barato.

Para los consumidores, el mercado de chatbots se está transformando en un modelo “freemium”: de forma gratuita, puedes acceder a un chatbot (a veces de segundo nivel) por un tiempo limitado, mientras que una suscripción mensual te ofrece los mejores modelos y niveles superiores o ilimitados. uso. Para las empresas, sin embargo, existe una estructura de precios más rigurosa basada tanto en preguntas como en respuestas, y Anthropic ha reducido OpenAI en el costo de los insumos y lo ha adaptado a los resultados. Y también cinco veces más barato que su mejor anterior.

Si no le gusta ver que los chatbots de IA aparecen cada vez con más frecuencia, probablemente esta sea una mala noticia para usted. Cada vez es más barato desarrollar su negocio en una empresa como Anthropic, y cada vez más empresas lo harán a medida que bajen los precios. La buena noticia es que cada actualización también mejora la capacidad de estas tareas.

En retrospectiva, el último año de avances en la IA ha sido extraño. Después del salto en capacidades traído por GPT-4 la primavera pasada, la frontera se ha movido a trompicones: Claude 3 y 3.5, y GPT-4o, todos representaron mejoras definitivas, pero ninguno del gran salto que la comunidad tecnológica IA insinuó que llegaría en breve.

Al mismo tiempo, la presencia de cualquier mejora debería ser alentadora. El hecho de que se puedan realizar cambios significativos, más allá de gastar mucho dinero en nuevos entrenamientos, sugiere que parte del misterio de cómo funcionan realmente estos sistemas se está aclarando y que el desarrollo de la IA está pasando del arte a la ciencia. Esto, a su vez, debería significar que los productos de los grandes entrenamientos, que ciertamente se están llevando a cabo, puedan transformarse en herramientas útiles y seguras lo antes posible.

Índice

Seguridad, hecha en Gran Bretaña
La UE no puede despedirnos: nos vamos

Seguridad, hecha en Gran Bretaña

Rishi Sunak habla en el segundo día de la Cumbre de Seguridad de Inteligencia Artificial (IA) del Reino Unido en Bletchley Park en noviembre. Fotografía: Toby Melville/AP

Hay una cola para el lanzamiento de Claude 3.5: su seguridad ha sido revisada por el gobierno del Reino Unido. Antrópico dice:

Como parte de nuestro compromiso con la seguridad y la transparencia, hemos trabajado con expertos externos para probar y perfeccionar los mecanismos de seguridad dentro de este último modelo. Recientemente proporcionamos el Claude 3.5 Sonnet al Instituto de Seguridad de Inteligencia Artificial (UK AISI) del Reino Unido para una evaluación de seguridad previa al despliegue. El AISI del Reino Unido completó las pruebas de 3.5 Sonnet y compartió los resultados con el Instituto de Seguridad de IA de EE. UU. (US AISI) como parte de un Memorando de Entendimiento, posible gracias a la asociación entre los AISI de EE. UU. y el Reino Unido anunciada a principios de este año.

Al igual que en las cumbres de IA de Bletchley y Seúl, el gobierno del Reino Unido ha logrado convertir lo que podría haber sido una peculiaridad tecnófila de Rishi Sunak en algo aparentemente duradero y exitoso. El hecho de que el Instituto de Seguridad de IA del Sector Público sea tan líder a nivel mundial que el gobierno de EE. UU. nos subcontrate su trabajo es realmente algo de lo que estar orgulloso.

La siguiente pregunta, por supuesto, es: ¿qué beneficio puede derivarse de ello? Es fácil conseguir un modelo de IA para probar si la empresa involucrada cree que pasará con gran éxito; La pregunta será si AISI puede cambiar los laboratorios de IA, en lugar de simplemente empujarlos y ver qué sucede.

omitir la promoción del boletín

La UE no puede despedirnos: nos vamos

Margrethe Vestager ofrece una conferencia de prensa sobre el caso antimonopolio de la UE en la App Store de Apple en Bruselas, Bélgica, el 4 de marzo de 2024. Fotografía: Olivier Hoslet/EPA

La guerra de Apple con la UE se está intensificando. El viernes, la compañía confirmó que no implementaría una serie de funciones nuevas para los usuarios de la UE, citando "incertidumbres regulatorias causadas por la Ley de Mercados Digitales (DMA)". De su declaración:

No creemos que podamos implementar tres de estas funciones (iPhone Mirroring, mejoras para compartir pantalla SharePlay y Apple Intelligence) para nuestros usuarios europeos este año.

En particular, nos preocupa que los requisitos de interoperabilidad de la DMA puedan obligarnos a comprometer la integridad de nuestros productos de manera que pongan en riesgo la privacidad del usuario y la seguridad de los datos. Estamos comprometidos a trabajar con Comisión Europea en un esfuerzo por encontrar una solución que nos permita proporcionar estas funciones a nuestros clientes de la UE sin comprometer su seguridad.

Es una prueba de Rorschach de una declaración. Si cree que la regulación de la UE es opresiva, proteccionista e inconsistente, entonces Apple está tomando la única medida sensata, limitando el lanzamiento de sus productos a las características menos controvertidas para evitar una posible multa multimillonaria.

Si, por otra parte, cree que la respuesta de Apple a la UE fue de travieso respeto e indignación ante la idea de una autoridad más legítima que la suya, entonces esto es sólo otro intento de disuadir a los gobiernos de seguir los pasos del bloque. .

La UE, al parecer, no se deja intimidar. El lunes anunció planes para demandar a Apple por incumplimiento de contrato:

En conclusiones preliminares, que Apple puede apelar, la Comisión Europea dijo que cree que sus reglas de interacción no cumplen con la Ley de Mercados Digitales (DMA) "porque impiden a los desarrolladores de aplicaciones dirigir libremente a los consumidores a canales alternativos para ofertas y contenidos".

Además, la Comisión ha abierto un nuevo procedimiento de incumplimiento contra Apple, al considerar que sus nuevos términos contractuales para desarrolladores de aplicaciones de terceros no cumplen con los requisitos de la DMA.

Para la UE, el principio es claro: si un cliente europeo quiere hacer negocios con una empresa europea, no debería tener el poder de un tercer país, empresa o persona para impedir el funcionamiento de ese mercado. En realidad, es lo más parecido que se puede llegar al ideal fundacional del bloque.

Pero eso no es exactamente lo que dice la DMA. De ahí el conflicto. Apple quiere seguir la letra de la ley manteniendo el mayor control posible sobre sus plataformas; La UE quiere interpretar la misma ley para dar la mayor libertad posible para un comercio fluido. No sé qué interpretación ganará esta vez, pero confío en mi predicción de que las convocatorias apenas comienzan.

Mira también

Si quieres conocer otros artículos parecidos a Claude 3.5 sugiere que la inminente omnipresencia de la IA podría ser algo bueno | Tecnología puedes visitar la categoría Tecnología.

Otras noticias que te pueden interesar