Sentence selection for improving the tuning process of a statistical machine translation system


Autoria(s): Lopez Ludeña, Veronica; San Segundo Hernández, Rubén; Montero Martínez, Juan Manuel; Lorenzo Trueba, Jaime
Data(s)

01/03/2012

Resumo

Este artículo describe una estrategia de selección de frases para hacer el ajuste de un sistema de traducción estadístico basado en el decodificador Moses que traduce del español al inglés. En este trabajo proponemos dos posibilidades para realizar esta selección de las frases del corpus de validación que más se parecen a las frases que queremos traducir (frases de test en lengua origen). Con esta selección podemos obtener unos mejores pesos de los modelos para emplearlos después en el proceso de traducción y, por tanto, mejorar los resultados. Concretamente, con el método de selección basado en la medida de similitud propuesta en este artículo, mejoramos la medida BLEU del 27,17% con el corpus de validación completo al 27,27% seleccionando las frases para el ajuste. Estos resultados se acercan a los del experimento ORACLE: se utilizan las mismas frases de test para hacer el ajuste de los pesos. En este caso, el BLEU obtenido es de 27,51%.

Formato

application/pdf

Identificador

http://oa.upm.es/16475/

Idioma(s)

eng

Publicador

E.T.S.I. Telecomunicación (UPM)

Relação

http://oa.upm.es/16475/1/INVE_MEM_2012_134533.pdf

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/4487

Direitos

http://creativecommons.org/licenses/by-nc-nd/3.0/es/

info:eu-repo/semantics/openAccess

Fonte

Procesamiento de Lenguaje Natural, ISSN 1135-5948, 2012-03, Vol. 2012, No. 48

Palavras-Chave #Telecomunicaciones #Filología
Tipo

info:eu-repo/semantics/article

Artículo

PeerReviewed