El habla es una capacidad humana de suma importancia ya que nos permite comunicarnos y relacionarnos con el mundo que nos rodea. Sin embargo, esta capacidad puede perderse por diversas razones, como lesiones o enfermedades. Cuando esto ocurre, las personas se ven obligadas a enfrentar importantes dificultades.

No obstante, un equipo de científicos ha dado pasos importantes para solucionar este problema. En este sentido, se ha desarrollado un sistema capaz de traducir los pensamientos en un discurso inteligible y reconocible a partir de los patrones de activación cerebral. Veamos de qué se trata.

Transformar el pensamiento en habla

Cuando las personas hablan, o se imaginan hablando, el cerebro muestra patrones de activación particulares. Sobre la base de esto, por décadas, los investigadores han tratado de registrar y procesar estos patrones a fin de transformar los pensamientos en un discurso verbal.

Sin embargo, la tarea no ha sido sencilla. Los primeros pasos en esta dirección se han centrado en modelos computacionales basados en representaciones visuales de frecuencias de sonido, llamados espectrogramas. No obstante, este enfoque no ha sido capaz de producir nada que simule un discurso comprensible.

A fin de superar esta dificultad, un equipo de investigadores recurrió a un algoritmo computacional que sintetiza el habla luego un entrenamiento a partir de grabaciones de personas hablando. Este algoritmo, llamado vocoder, es el mismo utilizado por asistentes personales como Siri y Amazon Echo.

En este caso, a fin de entrenar el vocoder a interpretar los patrones de activación cerebral, los investigadores usaron las respuestas cerebrales de un grupo de pacientes con epilepsia que fueron sometidos a una cirugía, luego de escuchar frases emitidas por distintas personas.

En la misma línea, se les solicitó a los participantes que escuchasen a otras personas mientras recitaban los números entre el 0 y el 9. Al mismo tiempo, se registraron los patrones de activación cerebral que se ejecutarían en el vocoder.

Posterior a ello, los sonidos resultantes del algoritmo ante estas señales fueron analizados y procesados por un tipo de inteligencia artificial que imita la estructura neuronal de un cerebro biológico, llamado redes neuronales.

El resultado final fue un discurso de una voz de sonido robótico recitando la secuencia de números. Adicionalmente, tras solicitarle a un grupo de personas que escucharan la grabación, se observó que el sonido gozaba de una alta precisión.

Una nueva oportunidad para aquellos que no pueden hablar

Pronto solo serían necesarios los pensamientos para comunicarse.

Tras poner a prueba el dispositivo, se encontró que las personas eran capaces de entender y repetir los sonidos resultantes del equipo hasta en el 75% de los casos.

Esto significa que los investigadores lograron transformar los pensamientos, representados por patrones de activación cerebral, en un discurso inteligible y reconocible.

Por tanto, los investigadores se han propuesto evaluar la posibilidad de emplear palabras y frases más complejas, a fin de mejorar el dispositivo. Este desarrollo podría implicar el diseño de un implante que traduce los pensamientos en palabras, facilitando la comunicación para aquellos que, por diversas razones, perdieron la capacidad del habla.

Referencia: Towards reconstructing intelligible speech from the human auditory cortex, (2019). https://doi.org/10.1101/350124