Automatic acquisition of Named Entities for Rule-Based Machine Translation
Contribuinte(s) |
International Workshop on Free/Open-Source Rule-Based Machine Translation (2nd : 2011 : Barcelona) |
---|---|
Data(s) |
15/05/2014
|
Resumo |
This paper proposes to enrich RBMTdictionaries with Named Entities(NEs) automatically acquired fromWikipedia. The method is appliedto the Apertium English-Spanishsystem and its performance comparedto that of Apertium with and withouthandtagged NEs. The system withautomatic NEs outperforms the onewithout NEs, while results vary whencompared to a system with handtaggedNEs (results are comparable forSpanish to English but slightly worstfor English to Spanish). Apart fromthat, adding automatic NEs contributesto decreasing the amount of unknownterms by more than 10%. Este artículo propone enriquecer los diccionarios de traducción automática basada en reglas con nombres de entidades adquiridos automáticamente de Wikipedia. El método se aplica al sistema inglés-español de Apertium y su comportamiento se compara con el de Apertium con o sin nombres de entidades etiquetadas a mano. El sistema con nombres de entidades supera el que no los tiene, mientras que los resultados varían cuando se compara con un sistema con nombres de entidades etiquetadas a mano (los resultados son comparables de español a inglés pero algo peores de inglés a español). Aparte de eso, añadir nombres de entidades automáticos contribuye a hacer disminuir la cantidad de términos desconocidos en más de un 10%. Aquest article proposa enriquir els diccionaris de traducció automàtica basada en regles amb noms d'entitats adquirides automàticament de la Viquipèdia. El mètode s'aplica al sistema anglès-espanyol de l'Apertium i els resultats es comparen amb els de l'Apertium amb noms d'entitats etiquetats a mà i sense. El sistema amb noms d'entitats automàtics supera el que no en té, mentre que els resultats varien quan es comparen amb un sistema amb noms d'entitats etiquetats a mà (els resultats són comparables d'espanyol a anglès, però una mica pitjors d'anglès a espanyol). Això a part, afegir noms d'entitats automàtics contribueix a disminuir la quantitat de termes desconeguts en més d'un 10%. |
Identificador | |
Idioma(s) |
eng |
Publicador |
Universitat Oberta de Catalunya |
Direitos |
<a href="http://creativecommons.org/licenses/by-nc-nd/3.0/es/">http://creativecommons.org/licenses/by-nc-nd/3.0/es/</a> |
Palavras-Chave | #Named Entitites #automatic acquisition #nombres de entidades #noms d'entitats #adquisición automática #adquisició automàtica #Open source software #Machine translating #Computational linguistics #Programari lliure #Traducció automàtica #Lingüística computacional #Software libre #Traducción automática #Lingüística computacional |
Tipo |
Conference lecture |