Síntesis del Habla Basada en HMM
Transcripción
Síntesis del Habla Basada en HMM
Síntesis del Habla Basada en HMM Introducción a las Tecnologías del Habla 2o cuatrimestre 2014 – Agustín Gravano Síntesis basada en HMM ● ● Salida del front-end del sistema TTS: ● Secuencia de fonemas a sintetizar: /s/ /o/ /l/. ● Duración y F0 de cada fonema. HMM entrenado del mismo modo que para reconocimiento. a a a 11 ● ● HMM de 5 estados para cada fonema. Concatenados para formar palabras. s0 a01 s1 b1(o) 22 a12 s2 3 a23 b2(o) 3 s3 a34 s4 b3(o) Síntesis basada en HMM /s/ /o/ /l/ Síntesis basada en HMM /s/ /o/ /l/ Vectores de atributos acústicos (MFCC, etc.): o1, o2, o3, … Combinarlos con la F0 permite reconstruir la señal de habla. Síntesis basada en HMM ● Ejemplos (con textos elegidos al azar): ● There are about a dozen people in this room. hmm-tts-dozen.wav ● Evolution is a change in the genetic make up of a population within a species. hmm-tts-evolution.wav ● Ventajas: ● Tamaño reducido: ~1MB ● Gran versatilidad para modificar parámetros prosódicos: – Tasa del habla, intensidad y f0.