Incorporación de n-gramas discriminativos para mejorar un reconocedor de idioma fonotáctico basado en i-vectores


Autoria(s): Salamea Palacios, Christian Raúl; D'haro Enríquez, Luis Fernando; Córdoba Herralde, Ricardo de; Caraballo Morcillo, Miguel Ángel
Data(s)

01/10/2013

Resumo

Este artículo describe una nueva técnica que permite combinar la información de dos sistemas fonotácticos distintos con el objetivo de mejorar los resultados de un sistema de reconocimiento automático de idioma. El primer sistema se basa en la creación de cuentas de posteriorgramas utilizadas para la generación de i-vectores, y el segundo es una variante del primero que tiene en cuenta los n-gramas más discriminativos en función de su ocurrencia en un idioma frente a todos los demás. La técnica propuesta permite obtener una mejora relativa de 8.63% en Cavg sobre los datos de evaluación utilizados para la competición ALBAYZIN 2012 LRE.

Formato

application/pdf

Identificador

http://oa.upm.es/26392/

Idioma(s)

eng

Publicador

E.T.S.I. Telecomunicación (UPM)

Relação

http://oa.upm.es/26392/1/INVE_MEM_2013_163608.pdf

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/issue/view/200

Direitos

http://creativecommons.org/licenses/by-nc-nd/3.0/es/

info:eu-repo/semantics/openAccess

Fonte

Procesamiento del Lenguaje Natural, ISSN 1135-5948, 2013-10, No. 51

Palavras-Chave #Telecomunicaciones
Tipo

info:eu-repo/semantics/article

Artículo

PeerReviewed