En una era de globalización donde conviven nada menos que 7.000 lenguas, entenderse entre sí se ha vuelto aún más complejo. Por lo tanto, los traductores se han multiplicado con el tiempo, como Google Translate, DeepL, Reverso o incluso Linguee, pero con alcance y capacidades limitadas. Con el avance de la IA generativa, las herramientas disponibles se fortalecen y ofrecen cada vez más traducciones de voz a texto y viceversa. Siguiendo esta tendencia, Meta ha desarrollado Sin costuraM4Tun modelo de traducción de IA multimodal y multilingüe todo en uno "que permite a las personas comunicarse sin esfuerzo a través de voz y texto en diferentes idiomas".

SeamlessM4T ofrece traducción de voz a voz aquí. (Crédito: Meta)

SeamlessM4T admite el reconocimiento de voz en casi 100 idiomas; traducción de voz a texto para casi 100 idiomas de entrada y salida; traducción de voz a voz, que admite casi 100 idiomas de entrada y 36 idiomas de salida (incluido el inglés); traducción de texto a texto para casi 100 idiomas y, finalmente, traducción de texto a voz, que admite casi 100 idiomas de entrada y 35 idiomas de salida (incluido el inglés).

SeamlessM4T ofrece traducción de voz a texto aquí. (Crédito: Meta)

Publicada bajo una licencia de investigación, la herramienta es, por lo tanto, de libre acceso para los investigadores y desarrolladores que quieran desarrollar este trabajo. Al mismo tiempo, la firma publicó los metadatos de SeamlessAlign, la base de datos en la que se basa la herramienta y que se describe como "el conjunto de datos de traducción multimodal abierto más grande hasta la fecha, con un total de 270.000 horas de alineaciones de discursos y textos. Este traductor universal representa un importante desafío porque los sistemas existentes de texto a voz y de texto a texto solo cubren una pequeña porción de los idiomas del mundo. Según Meta, el sistema SeamlessM4T se destaca de otros enfoques que utilizan modelos distintos al reducir notablemente los errores. y retrasos y, en última instancia, aumentar la eficiencia y la calidad del proceso de traducción.

Buscando un traductor universal

La empresa lleva varios años trabajando en el proyecto de un traductor universal. El año pasado, la empresa lanzó No Language Left Behind (NLLB), un modelo de traducción automática de texto a texto que admite 200 idiomas y que desde entonces se ha integrado en Wikipedia como uno de los proveedores de traducción. También se realizó una demostración de su traductor universal de voz. Finalmente, a principios de este año, la compañía presentó Massively Multilingual Speech, que proporciona reconocimiento de voz, identificación de idioma y tecnología de conversión de texto a voz en más de 1100 idiomas.

"SeamlessM4T se basa en los resultados de todos estos proyectos", afirma Meta. Por supuesto, la firma no piensa quedarse ahí y analiza desarrollos futuros. "En el futuro, queremos explorar cómo este modelo fundamental puede permitir nuevas capacidades de comunicación, acercándonos a un mundo donde todos puedan ser comprendidos". En cualquier caso, la búsqueda de un traductor universal parece haber llegado a buen término con Meta.