MARCOS TREVISAN - Coordenadas anatómicas discretas para la síntesis de voz

Marcos Trevisan.

IFIBA - DF FCEyN - UBA

Jueves 5/9/2019, 14 hs.

Aula Seminario, 2do piso, Pab. I.

Coordenadas anatómicas discretas para la síntesis de voz

Los sonidos del habla se describen con un conjunto finito de símbolos, que se extraen del continuo de sonidos producidos por el sistema vocal. En este trabajo mostramos que es posible obtener esta discretización a partir de los movimientos continuos del tracto vocal durante la pronunciación de la voz.

Para eso registramos los movimientos producidos durante el habla usando imanes y transductores de efecto Hall montados en la lengua, labios y mandíbula. Usando una estrategia de umbrales, convertimos las señales de los transductores en coordenadas motoras discretas asociadas unívocamente a las vocales y consonantes pronunciadas. A partir de esta descripción, creamos un dispositivo que integra un modelo vocal de baja dimensión capaz de sintetizar la voz original a partir de las señales de los transductores.

Estos resultados sugieren que los sonidos del lenguaje pueden ser codificados en un espacio discreto de baja dimensión. Esto representa una alternativa a los modelos existentes, que sintetizan voz a partir de grandes cantidades de datos anatómicos y fisiológicos.