Logo de Facebook sobre un fondo compuesto por banderas del mundo

Este 19 de octubre, Facebook dio a conocer que ha creado la primera inteligencia artificial capaz de traducir 100 idiomas, total y completamente independiente.

La IA que ejecuta este código se presenta bajo el nombre de M2M-100. Este software “puede traducir entre cualquier par de 100 idiomas sin depender de los datos del inglés”.

Angela Fan, asistente de investigación de Facebook, señala que la mayoría de los traductores multilingües usan el inglés como puente para traducir de un idioma a otro.

Destaca que el texto traducido pierde sentido, ya que al cambiar de lenguaje, este se adapta al dialecto de una región, y al final el resultado puede verse alterado y no reflejar lo que en realidad se quiso transmitir. En su blog, se lee lo siguiente:

“Este hito es la culminación de años del trabajo fundamental de Facebook AI en la traducción automática. Hoy, compartimos detalles sobre cómo creamos un modelo y un conjunto de datos de entrenamiento MMT más diverso para 100 idiomas”.

El M2M es más potente que cualquier otro traductor

Fan señala que el modelo de IA de Facebook contiene un total de “2200 direcciones de usuarios”, lo que se traduce en 10 veces más potencia que cualquier otro traductor multilingüe.

Asimismo, recalcó que la implementación de este software es con fines investigativos, y que servirá para mejorar la calidad de sus traducciones. Aunque, quizás más adelante se use para mejorar la capacidades de sus plataformas sociales.

Sin embargo, hizo referencia a que no fue fácil. Uno de sus mayores obstáculos fue seleccionar “oraciones de calidad”. Frases paralelas entre un idioma y otro. No estamos hablando de una, sino millones de palabras.

Aún más, evitando frases que chocaran con el inglés, pues, es más fácil encontrar traducciones que lo involucren. Después de todo, es una de las lenguas más utilizadas en el mundo. Facebook no la tuvo fácil.

Tal es el grado de satisfacción de Facebook frente a este diseño, que ha puesto a disposición de su comunidad el código usado para desarrollar dicha aplicación. Inclusive, manifiesta que está “lanzando la configuración del modelo, la capacitación y la evaluación para ayudar a otros investigadores a reproducir y avanzar más en los modelos multilingües”.