La tecnología de cancelación de ruido, ampliamente utilizada en auriculares convencionales y profesionales con el fin de proporcionar una experiencia de mejor calidad, ha sido probada recientemente por la Interpol para reconocer voces de criminales en grabaciones de conversaciones y publicaciones de redes sociales en todo el mundo.

Sin embargo, esta tecnología aún tiene una debilidad, y es que no ha sido capaz de escuchar a una persona en específico dentro de una multitud, al igual que lo hace un humano cuando hace un “silencio mental” decidiendo cuál persona de la multitud ruidosa va a escuchar por separado.

Eso es precisamente lo que los investigadores de Google desean lograr con su nueva tecnología de cancelación de ruido basada en Inteligencia Artificial (IA). Al igual que alguien que escucha una conversación en una gran fiesta llena de personas, esta IA sería capaz de aislar el ruido de fondo en los videos para escuchar lo que está diciendo una persona en particular en la pantalla.

Lo que han buscado imitar los investigadores con esta tecnología es el ‘efecto de fiesta cóctel’, un fenómeno que nos hace capaces de focalizar nuestra atención auditiva en un estímulo particular al tiempo que se filtran mayores estímulos, de la misma forma que una persona puede centrar su atención en una sola charla dentro de una sala con mucho ruido.

En este sentido, la IA está diseñada para utilizar señales de audio y señales visuales, como los movimientos de la boca, para separar los sonidos que producen diferentes personas al hablar. Durante las pruebas, los investigadores utilizaron videos similares a una fiesta cóctel con dos o tres personas conversando y varios niveles de ruido de fondo. En este sentido, la IA distinguió qué sonidos provenían de cada persona o agente de sonido en la sala.

La tecnología podría ser utilizada para subtitular videos con más precisión que los sistemas de transcripción actuales. Además, los expertos dijeron que esperan desarrollar aún más su sistema para filtrar el ruido de fondo de las transmisiones en streaming para ayudar a los usuarios a escuchar mejor a quienes dirigen las teleconferencias.

Más en TekCrispy