Reutilización del Treebank de dependencias del euskera para la construcción del gold standard de la sintaxis superficial de la gramática de restricciones (CG)


Autoria(s): Arriola Egurrola, José María; Aranzabe Urruzola, María Jesús; Goenaga, Iakes
Data(s)

11/09/2013

11/09/2013

01/09/2013

Resumo

El objetivo del trabajo consiste en reutilizar el Treebank de dependencias EPECDEP (BDT) para construir el gold standard de la sintaxis superficial del euskera. El paso básico consiste en el estudio comparativo de los dos formalismos aplicados sobre el mismo corpus: el formalismo de la Gramática de Restricciones (Constraint Grammar, CG) y la Gramática de Dependencias (Dependency Grammar, DP). Como resultado de dicho estudio hemos establecido los criterios lingüísticos necesarios para derivar la funciones sintácticas en estilo CG. Dichos criterios han sido implementados y evaluados, así en el 75% de los casos se derivan automáticamente las funciones sintácticas para construir el gold standard.

The aim of the work is to profit the existing dependency Treebank EPEC-DEP (BDT) in order to build the gold standard for the surface syntax of Basque. As basic step, we make a comparative study of both formalisms, the Constraint Grammar formalism (CG) and the Dependency Grammar (DP) that have been applied on the corpus. As a result, we establish some criteria that will serve us to derive automatically the CG style syntactic function tags. Those criteria were implemented and evaluated; as a result, in the 75 % of the cases we are able to derive the CG style syntactic function tags for building the gold standard.

Este trabajo ha sido financiado por el Gobierno Vasco (IT344-10).

Identificador

ARRIOLA, José María; ARANZABE, María Jesús; GOENAGA, Iakes. “Reutilización del Treebank de dependencias del euskera para la construcción del gold standard de la sintaxis superficial de la gramática de restricciones (CG)”. Procesamiento del Lenguaje Natural. N. 51 (2013). ISSN 1135-5948, pp. 83-90

1135-5948

http://hdl.handle.net/10045/30600

Idioma(s)

spa

Publicador

Sociedad Española para el Procesamiento del Lenguaje Natural

Direitos

info:eu-repo/semantics/openAccess

Palavras-Chave #Reutilización de recursos lingüísticos #Creación gold standard #Sintaxis superficial #Reusability of linguistic resources #Gold standard creation #Surface syntax #Lenguajes y Sistemas Informáticos
Tipo

info:eu-repo/semantics/article