Biblioteca Digital

New experiments on speaker diarization for unsupervised speaking style voice building for speech synthesis

**Autoria(s):** Martínez González, Beatriz; Pardo Muñoz, José Manuel; Echeverry Correa, Julian David; Montero Martínez, Juan Manuel
Data(s)	01/03/2014
Resumo	El uso universal de síntesis de voz en diferentes aplicaciones requeriría un desarrollo sencillo de las nuevas voces con poca intervención manual. Teniendo en cuenta la cantidad de datos multimedia disponibles en Internet y los medios de comunicación, un objetivo interesante es el desarrollo de herramientas y métodos para construir automáticamente las voces de estilo de varios de ellos. En un trabajo anterior se esbozó una metodología para la construcción de este tipo de herramientas, y se presentaron experimentos preliminares con una base de datos multiestilo. En este artículo investigamos más a fondo esta tarea y proponemos varias mejoras basadas en la selección del número apropiado de hablantes iniciales, el uso o no de filtros de reducción de ruido, el uso de la F0 y el uso de un algoritmo de detección de música. Hemos demostrado que el mejor sistema usando un algoritmo de detección de música disminuye el error de precisión 22,36% relativo para el conjunto de desarrollo y 39,64% relativo para el montaje de ensayo en comparación con el sistema base, sin degradar el factor de mérito. La precisión media para el conjunto de prueba es 90.62% desde 76.18% para los reportajes de 99,93% para los informes meteorológicos.
Formato	application/pdf
Identificador	http://oa.upm.es/37410/
Idioma(s)	eng
Publicador	E.T.S.I. Telecomunicación (UPM)
Relação	http://oa.upm.es/37410/1/INVE_MEM_2014_193777.pdf http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/4906 TIN2011-28169-C05-03 DPI2010-21247-C02-02 info:eu-repo/grantAgreement/EC/FP7/FP7-ICT-2011-7 287678 S2009/TIC-1542
Direitos	http://creativecommons.org/licenses/by-nc-nd/3.0/es/ info:eu-repo/semantics/openAccess
Fonte	Procesamiento del Lenguaje Natural, ISSN 1135-5948, 2014-03, Vol. 52
Palavras-Chave	#Telecomunicaciones
Tipo	info:eu-repo/semantics/article Artículo PeerReviewed

Acesso ao item digital