The Tibidabo Treebank


Autoria(s): Marimon Felipe, Montserrat
Contribuinte(s)

Universitat de Barcelona

Resumo

En este artículo presentamos el desarrollo de un nuevo recurso de código abierto para el español: el treebank Tibidabo. La anotación se está llevando a cabo de forma semiautomática en la que, en primer lugar, el corpus es analizado automaticamente con una gramática simbólica del español basada en HPSG e implementada en el sistema Linguistic Knowledge Builder, y, en segundo lugar, los resultados del proceso de análisis se desambiguan manualmente. La existencia del treebank Tibidabo nos permitirá futuros trabajos de investigación para el desarrollo y evaluación de una arquitectura híbrida que combine métodos simbólicos y estadísticos para el PLN, así como investigaciones orientadas a la hibridización de técnicas de bajo y alto nivel para el PLN.

Identificador

http://hdl.handle.net/2445/33022

Idioma(s)

eng

Publicador

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)

Direitos

(c) Marimon Felipe, Montserrat, 2010

info:eu-repo/semantics/openAccess

Palavras-Chave #Castellà (Llengua) #Lingüística computacional #Gramàtica #Tecnologia de la informació #Spanish language #Computational linguistics #Grammar #Information technology
Tipo

info:eu-repo/semantics/article

info:eu-repo/semantics/publishedVersion