Foto: BBC

Google ha presentado un novedoso modelo de traducción de extremo a extremoque toma oraciones por voz en un idioma y crea palabras habladas en otro con la ayuda de Inteligencia Artificial (IA). Su nombre es Translatotron, y aunque aún se encuentra en fase de pruebas, es el resultado de varios años de esfuerzos de la compañía por crear un sistema de traducción directa de voz a voz.

Traducción por voz de extremo a extremo

Hasta ahora, las traducciones de voz se basan en el reconocimiento automático de la voz para convertirla a texto y traducirla. Luego, utiliza una salida de texto a voz para finalmente generar la traducción. Sin embargo, Translatotron va mucho más allá, al ser un sistema totalmente de ‘extremo a extremo’, completando las traducciones de manera más rápida y con menor complejidad que las herramientas actuales. A través de una publicación en su blog, la compañía dijo:

Según nuestro conocimiento, Translatotron es el primer modelo de extremo a extremo que puede traducir directamente el habla de un idioma a otro en otro idioma. También es capaz de retener la voz del orador de origen en el discurso traducido.

La puntuación BLEU, que permite medir las diferencias entre las traducciones automáticas y las de referencia que fueron creadas por la misma persona que originó la oración, calificó la traducción automática de Translatotron con una calidad inferior a los sistemas convencionales de cascada. Sin embargo, el sistema experimental de Google generó traducciones más precisas que las traducciones de base en línea.

La IA, computación cuántica y la tecnología 5G podrían afectar la seguridad en un futuro

¿Cómo funciona?

Para realizar las traducciones de voz de extremo a extremo, los investigadores utilizaron espectogramas como datos para entrenar la IA y un modelo de secuencia a secuencia. En este sentido, aplicaron un codificador de altavoz con el objetivo de recopilar el carácter de la voz de la persona que habla, y finalmente se utiliza el aprendizaje de múltiples tareas para predecir las palabras pronunciadas por los oradores al inicio y al final.

A pesar de que se trata de un proyecto en fase de pruebas, Google ve en Translatotron un gran recurso para mejorar su asistente inteligente, Google Assistant. En este sentido, la compañía podría optimizar el modo de intérprete del asistente, que fue presentado en enero pasado.

Más en TekCrispy