La IA de traducción de Google estropea los términos legales 'imponer,' adornar ': investigación
hace 4 años
(Mundo Informático) - Las herramientas de traducción de Google de Alphabet Inc y otras compañías podrían estar contribuyendo a un malentendido significativo de términos legales con significados conflictivos como "prohibir", según una investigación que se presentará en un taller académico el lunes.
El software de traducción de Google convierte una oración en inglés sobre un tribunal que ordena la violencia, o la prohíbe, en una en el idioma indio de Kannada que implica que el tribunal ordenó la violencia, según el nuevo estudio aquí.
"Disfrutar" puede referirse a promover o restringir una acción. Las traducciones erróneas también surgen con otros contrónimos, o palabras con significados contradictorios según el contexto, que incluyen "todo", "eventual" y "adornar", dijo el periódico.
Google dijo que la traducción automática "sigue siendo solo un complemento de la traducción profesional especializada" y que está "investigando continuamente mejoras, desde un mejor manejo del lenguaje ambiguo hasta la mitigación del sesgo y la obtención de grandes ganancias de calidad para los idiomas de escasos recursos".
Los hallazgos del estudio se suman al escrutinio de las traducciones automáticas generadas por software de inteligencia artificial. Los investigadores han encontrado anteriormente programas que aprenden traducciones mediante el estudio de textos no diversos que perpetúan los prejuicios históricos de género, como asociar "doctor" con "él".
El nuevo documento plantea preocupaciones sobre un método popular que utilizan las empresas para ampliar el vocabulario de su software de traducción. Traducen texto extranjero al inglés y luego de nuevo al idioma extranjero, con el objetivo de enseñar al software a asociar formas similares de decir la misma frase.
Este proceso, conocido como traducción inversa, tiene problemas con los contrónimos, dijo Vinay Prabhu, científico jefe de la empresa de autenticación UnifyID y uno de los autores del artículo.
Cuando tradujeron una sentencia sobre un tribunal que prohibía la violencia a 109 idiomas con el apoyo del software de Google, la mayoría de los resultados erraron. Cuando regresó al inglés, 88 traducciones posteriores dijeron que el tribunal pidió violencia y solo 10 dijeron correctamente que el tribunal lo prohibió. El resto generó otros problemas.
Otro investigador, Abubakar Abid, tuiteó en diciembre que encontró un posible sesgo en la traducción inversa a través del turco. Utilizando Google, frases cortas con "ordenan" traducidas a "gente" y "musulmanes" ordenando la violencia, pero el "gobierno" y la "CIA" la proscriben.
El nuevo documento dijo que los problemas de traducción podrían tener graves consecuencias a medida que más empresas utilicen la inteligencia artificial para generar o traducir texto legal. Un ejemplo en el periódico es un titular de noticias sobre la violencia doméstica no letal que convierte "golpe" en "asesinado" durante la traducción, una asociación potencialmente verdadera pero problemática.
Los autores también expresaron su preocupación por la falta de advertencias y puntuaciones de confianza en las herramientas de Google y otros. Google en los materiales de soporte advierte que es posible que no tenga la mejor solución "para la traducción especializada en sus propios campos".
Informe de Paresh Dave en Oakland, California; Editado por Matthew Lewis
Nuestros estándares: los principios de confianza de Thomson Mundo Informático.
Si quieres conocer otros artículos parecidos a La IA de traducción de Google estropea los términos legales 'imponer,' adornar ': investigación puedes visitar la categoría Tecnología.
Otras noticias que te pueden interesar