El Grupo de Press Ousest-France crea un laboratorio de investigación común con los CNR y la Universidad de Rennes, para desarrollar técnicas para explotar sus archivos de medios voluminosos y variados. Las sinapas de LabCom funcionarán en los medios para explotar con diferentes variaciones de IA durante 125 años de archivos digitales. El grupo nacido en 1899, con la creación de West Eclair, está a la cabeza de un imponente patrimonio de 48 millones de artículos, 38 millones de fotos, 17 millones de páginas, 116,000 videos, muchos de los cuales no son fácilmente explotables, incluidas las herramientas de IA existentes. La compañía evoca en particular las dificultades vinculadas a la evolución de los campos semánticos utilizados en estos documentos a lo largo del tiempo.

Es el equipo de investigación Linkmedia Irisa (Instituto de Investigación en Ciencias de la Computación y Sistemas Random - CNRS/Universidad de Rennes), dirigido por Laurent Amsaleg, quien pilotará el laboratorio con Michel Le Nouy, ​​jefe de la investigación de TI aplicada y IA en OUest -France. Uno de los dos sujetos de estudio de Linkmedia se refiere a “Métodos, técnicas y herramientas para explorar la naturaleza de estas colecciones de documentos multimedia extremadamente grandes [...] Con un corpus de herramientas informáticas: IA, aprendizaje automático, aprendizaje profundo, computación, análisis multimedia, tratamiento de lenguaje natural (PNL), aprendizaje automático de idiomas, información y exploración de datos. "Las sinapsis LabCom serán financiadas por la ANR (Agencia Nacional de Investigación) hasta 363,000 €.

Desarrollo de prototipos de datos reales

Con este laboratorio común, Ousest-France formaliza una colaboración informal que ha estado sucediendo durante 30 años. Por lo tanto, el grupo afirma querer "acceder a las tecnologías de corte de corte mientras mantiene la soberanía en sus datos y garantiza el cumplimiento de los derechos de las personas mencionadas, fotografiadas o grabadas dentro de este vasto archivo". Los investigadores de Irisa, por su parte, tendrán una base documental particularmente rica para probar y cambiar su trabajo, así como para crear prototipos de herramientas a partir de datos y casos reales.

Los dos co -pilots del proyecto, Michel Le Nouy, ​​en Ouest-France, y Laurent Amsaleg, en CNRS, explica en una entrevista diaria que acaban de finalizar los elementos de gobernanza y los aspectos legales (propiedad intelectual, valoración) del laboratorio. Ahora iniciarán trabajo sobre los tres principales ejes de investigación para aplicar la inteligencia artificial al servicio del periodismo que han definido: facilitar el análisis y buscar fotos, explotar más de 100 años de archivos textuales al superar los desafíos planteados por los desarrollos lingüísticos y, finalmente, desarrollar herramientas para ver datos complejos e interconectados.

Un tema de soberanía contra los gafams

La creación del laboratorio también es un tema de soberanía y, potencialmente, de capacidad para que los medios se deshagan de los modelos de IA de los principales actores tecnológicos. En el artículo, Laurent Amsaleg responde sobre todo a querer "adquirir una comprensión interna de lo que AI significa para el periodismo. Este conocimiento nos permitirá comprender finamente el poder y los límites de las soluciones propuestas en particular por los gafams". A lo que Michel Le Nouy, ​​agrega: "También queremos dominar el comienzo a finalizar lo que la IA hace nuestros datos, esto en conexión con nuestro requisito de s de s. y ADN de OUest-France ”.