Síntesis del Habla Basada en HMM

Transcripción

Síntesis del Habla Basada en HMM
Síntesis del Habla Basada en HMM
Introducción a las Tecnologías del Habla
2o cuatrimestre 2014 – Agustín Gravano
Síntesis basada en HMM
●
●
Salida del front-end del sistema TTS:
●
Secuencia de fonemas a sintetizar: /s/ /o/ /l/.
●
Duración y F0 de cada fonema.
HMM entrenado del mismo modo que para
reconocimiento.
a
a
a
11
●
●
HMM de 5 estados
para cada fonema.
Concatenados para
formar palabras.
s0
a01
s1
b1(o)
22
a12
s2
3
a23
b2(o)
3
s3
a34
s4
b3(o)
Síntesis basada en HMM
/s/
/o/
/l/
Síntesis basada en HMM
/s/
/o/
/l/
Vectores de atributos acústicos (MFCC, etc.): o1, o2, o3, …
Combinarlos con la F0 permite reconstruir la señal de habla.
Síntesis basada en HMM
●
Ejemplos (con textos elegidos al azar):
●
There are about a dozen people in this room.
hmm-tts-dozen.wav
●
Evolution is a change in the genetic make up of a population
within a species.
hmm-tts-evolution.wav
●
Ventajas:
●
Tamaño reducido: ~1MB
●
Gran versatilidad para modificar parámetros prosódicos:
–
Tasa del habla, intensidad y f0.

Documentos relacionados