Construcción de los WordNets 3.0 para castellano y catalán mediante traducción automática de corpus anotados semánticamente


Autoria(s): Oliver González, Antoni
Data(s)

26/07/2011

Resumo

Este artículo describe una metodología de construcción de WordNets que se basa en la traducción automática de un corpus en inglés desambiguado por sentidos. El corpus que utilizamos está formado por las propias glosas de WN 3.0 etiquetadas semánticamente y por el corpus Semcor. Los resultados de precisión son comparables a los obtenidos mediante métodos basados en diccionarios bilingües para las mismas lenguas. La metodología descrita se está utilizando, en combinación con otras estrategias, en la creación de los WordNets 3.0 del español y catalán.

This paper describes a methodology for the construction of WordNets based on machine translation of an English sense tagged corpus. We use the Semcor corpus and the WordNet 3.0 sense tagged glosses as a corpus. Precision results are comparable to those obtained by methods based on bilingual dictionaries for the same languages. This methodology is being used for the construction of the Spanish and Catalan WordNets 3.0 in combination with other strategies.

Identificador

http://hdl.handle.net/10609/8172

Idioma(s)

spa

Publicador

Universitat Oberta de Catalunya

Direitos

<a href="http://creativecommons.org/licenses/by-sa/3.0/es/">http://creativecommons.org/licenses/by-sa/3.0/es/</a>

Palavras-Chave #WordNet #recursos lingüísticos #traducción automática
Tipo

Master thesis