Mientras la IA generativa está en su apogeo, el discurso de Yann LeCun, una de las figuras más importantes de la inteligencia artificial, en el Festival Mundial de la IA de Cannes (que se celebra del 8 al 10 de febrero), es suficiente para sacudir las certezas. Para el investigador, ahora director de investigación en IA en Meta, los LLM, que llevan la ola de la IA generativa, tienen un futuro limitado. En primer lugar, porque solo se aplican al lenguaje (la segunda L del acrónimo).

Sin embargo, para el investigador, este planteamiento es insuficiente para alcanzar lo que considera el objetivo actual de la investigación en IA: crear una multitud de asistentes que guíen a los humanos en todas sus interacciones con los mundos digitales. "Para ello, la tecnología debe alcanzar las capacidades humanas, la planificación, el razonamiento, la memoria o incluso el sentido común. Lo cual está totalmente fuera de las posibilidades de los LLM", afirma el investigador, considerado uno de los inventores del Deep Learning. Y apunta, como ejemplo, que pese al entusiasmo actual en torno a la IA, ningún robot es aún capaz de realizar una tarea tan sencilla como limpiar y limpiar una mesa. "Nos falta algo importante", insiste el premio Turing 2018.

“Probablemente estemos hablando de décadas de trabajo”

Para avanzar hacia lo que él llama AMI (Advanced Machine Intelligence), Yann LeCun considera que ni los métodos de aprendizaje actuales ni el enfoque en el lenguaje serán suficientes para dar los siguientes pasos. "Los LLM no son capaces de planificar. Además, no comprenden la realidad subyacente a los conceptos que manipulan", observa el investigador francés.

Aunque el camino hacia la IA probablemente sea arduo, Yann LeCun cree que este salto cuántico en las capacidades de la IA es posible. "Ya ni me hago esa pregunta: va a suceder. ¿Será mañana, en 3 años, en 5 años? Es más probable que estemos hablando de décadas de trabajo", continúa el director de investigación en IA de Meta.

En primer lugar, las capacidades de aprendizaje aún deben aumentar drásticamente. Por supuesto, según los órdenes de magnitud dados por el investigador, un LLM hoy en día ingiere alrededor de 170.000 años de lectura humana. Pero, según Yann LeCun, un niño de 4 años, durante sus 160.000 horas de vigilia, fue capaz de refinar su percepción del mundo a través de "50 veces más datos que cualquier LLM", solo a través de la vista. Además, para Yann LeCun, centrar el aprendizaje en el lenguaje no es suficiente para comprender el mundo. Por lo tanto, el problema no se limita a un aumento de la potencia de cálculo. "La IA generativa no será significativamente mejor al aumentar la potencia de cálculo. Debemos enseñar a los sistemas a comprender el mundo", afirma el investigador.

Secuencia óptima de acciones en función de los objetivos definidos

Sin embargo, esta mera ampliación de las tipologías de datos de aprendizaje no es suficiente para abrir el camino a la AMI. Yann LeCun imagina una nueva arquitectura de IA controlada por objetivos (de ahí el nombre de su intervención Objective-driven AI). Esquemáticamente, el sistema que diseña combina su percepción del mundo en un momento dado t con la memoria del mismo que ha almacenado para actualizar su modelo del entorno, construido durante la fase de aprendizaje. Es este modelo el que sirve de base para calcular el efecto que tendrá una acción dada que el sistema debe decidir, en función de los objetivos y las salvaguardias que se le han asignado previamente. "El sistema tendrá que calcular la secuencia de acciones que minimicen las funciones objetivo, sabiendo que estos objetivos y salvaguardias estarán codificados en el sistema", explica Yann LeCun. Una garantía suficiente, según él, para evitar que estos sistemas sean secuestrados con fines maliciosos.

Si bien este sistema utiliza técnicas ya conocidas, deberá incorporar nuevos componentes, en particular para garantizar la planificación jerárquica. En este tortuoso camino hacia la AMI, Yann LeCun destaca el trabajo en torno a las arquitecturas JEPA (Joint Embedding Predictive Architecture). El pasado mes de junio, Meta, en colaboración con universidades, presentó el proyecto resultados de una arquitectura de este tipo capaz de completar imágenes, a partir de un modelo entrenado mediante aprendizaje autodirigido. Una simple piedra en el edificio que Yann LeCun está diseñando. Un edificio que, según él, tendrá que apoyarse necesariamente en cimientos de código abierto.

“La IA no debería estar controlada por unas pocas empresas privadas”

“Necesitamos una amplia variedad de asistentes basados ​​en IA que se adapten a diferentes idiomas, culturas o intereses. Para lograrlo, será esencial una plataforma de código abierto que permita a los usuarios ajustar los modelos”, afirma el investigador. “Esta tecnología no debería estar totalmente controlada por un puñado de empresas de la Costa Oeste (de Estados Unidos, n.d.r.) o de China. Estoy convencido de que el código abierto dominará los desarrollos tecnológicos en IA del futuro. En cierto modo, ya lo hace”. La plataforma HuggingFace, por ejemplo, especializada en compartir tecnologías de IA en código abierto, ya contiene más de 5.000 modelos preentrenados.