Automatic acquisition of Named Entities for Rule-Based Machine Translation


Autoria(s): Toral, Antonio; Way, Andy
Contribuinte(s)

International Workshop on Free/Open-Source Rule-Based Machine Translation (2nd : 2011 : Barcelona)

Data(s)

15/05/2014

Resumo

This paper proposes to enrich RBMTdictionaries with Named Entities(NEs) automatically acquired fromWikipedia. The method is appliedto the Apertium English-Spanishsystem and its performance comparedto that of Apertium with and withouthandtagged NEs. The system withautomatic NEs outperforms the onewithout NEs, while results vary whencompared to a system with handtaggedNEs (results are comparable forSpanish to English but slightly worstfor English to Spanish). Apart fromthat, adding automatic NEs contributesto decreasing the amount of unknownterms by more than 10%.

Este artículo propone enriquecer los diccionarios de traducción automática basada en reglas con nombres de entidades adquiridos automáticamente de Wikipedia. El método se aplica al sistema inglés-español de Apertium y su comportamiento se compara con el de Apertium con o sin nombres de entidades etiquetadas a mano. El sistema con nombres de entidades supera el que no los tiene, mientras que los resultados varían cuando se compara con un sistema con nombres de entidades etiquetadas a mano (los resultados son comparables de español a inglés pero algo peores de inglés a español). Aparte de eso, añadir nombres de entidades automáticos contribuye a hacer disminuir la cantidad de términos desconocidos en más de un 10%.

Aquest article proposa enriquir els diccionaris de traducció automàtica basada en regles amb noms d'entitats adquirides automàticament de la Viquipèdia. El mètode s'aplica al sistema anglès-espanyol de l'Apertium i els resultats es comparen amb els de l'Apertium amb noms d'entitats etiquetats a mà i sense. El sistema amb noms d'entitats automàtics supera el que no en té, mentre que els resultats varien quan es comparen amb un sistema amb noms d'entitats etiquetats a mà (els resultats són comparables d'espanyol a anglès, però una mica pitjors d'anglès a espanyol). Això a part, afegir noms d'entitats automàtics contribueix a disminuir la quantitat de termes desconeguts en més d'un 10%.

Identificador

http://hdl.handle.net/10609/5644

Idioma(s)

eng

Publicador

Universitat Oberta de Catalunya

Direitos

<a href="http://creativecommons.org/licenses/by-nc-nd/3.0/es/">http://creativecommons.org/licenses/by-nc-nd/3.0/es/</a>

Palavras-Chave #Named Entitites #automatic acquisition #nombres de entidades #noms d'entitats #adquisición automática #adquisició automàtica #Open source software #Machine translating #Computational linguistics #Programari lliure #Traducció automàtica #Lingüística computacional #Software libre #Traducción automática #Lingüística computacional
Tipo

Conference lecture