Grabador de voz

Microsoft está permitiendo el acceso a su nueva inteligencia artificial neuronal que transforma cadenas de texto a voz, pero de forma limitada. Un algoritmo que permite crear voces sintéticas personalizadas.

Esta nueva herramienta forma parte del servicio de la nube de Microsoft, Azure. Además se conoce bajo el nombre de Speech. Esta tecnología se crea para facilitar la lectura de audiolibros o noticias, así como patrón para asistentes o dispositivos inteligentes dirigidos por voz, entre otros servicios.

¿Cómo hago para acceder a la nueva IA neuronal de Microsoft?

Si bien es cierto que el gigante tecnológico habilitó el acceso a Speech, lo hizo de forma limitada. Siempre que quieras acceder a esta inteligencia artificial basada en la nube deberás solicitar permiso, al igual que esperar la aprobación por parte de Microsoft.

Una vez que la empresa aprueba la solicitud, podrás empezar a utilizar la nueva herramienta y adaptar tus textos al tono de voz que sea de tu agrado. Incluso, estas voces se distinguen, porque suenan más natural que muchas otras ofrecidas por otros servicios de voz, según indica Microsoft.

“Las grabaciones se utilizan para crear una fuente de sonidos o fonemas. Es algo similar a una fuente en una computadora que contiene letras y caracteres que se combinan para formar palabras y oraciones. Pero la conversión neuronal de texto a voz va más allá de juntar sonidos para formar palabras”, explica la compañía. Estos patrones ayudan a que la pronunciación sea más clara y precisa, haciéndola lo más natural posible.

Speech está ayudando a organizaciones sin fines lucro

Custom Neural Voice, voz neuronal personalizada en español, es una tecnología que se adapta perfectamente a la educación. Esto debido a que se puede utilizar para enseñar idiomas, además de emplearse para leer y escuchar libros.

Incluso, esta tecnología está ayudando a organizaciones sin fines lucro, como el Centro de Servicios para Personas con Discapacidades Visuales de Beijing Hongdandan, a generar contenido de audio para personas ciegas o con problemas de visión.

Por otro lado, también se ha implementado para despertar el interés de los usuarios. Por ejemplo, AT&T y Warner Bros instalaron un sistema en AT&T Experience Store en Dallas, donde la gente puede interactuar con la voz Bugs Bunny. De hecho, han combinado a Speech con la tecnología 5G y realidad aumentada para hacer la interacción más real.

Y tú, ¿ya probaste esta IA que transforma texto a voz? Cuéntanos tu experiencia.