Rol semantikoen etiketatze automatikoa : rol multzoak eta hautapen murriztapenak


Autoria(s): Zapirain Sierra, Beñat
Contribuinte(s)

Márquez Villodre, Lluis

Aguirre Bengoa, Eneko

Lenguajes y Sistemas Informáticos/Hizkuntza eta Sistema Informatikoak

Data(s)

15/07/2013

15/07/2013

23/02/2011

23/02/2011

Resumo

158 p. : graf.

[Eus]Tesi honetan, Rolen Sailkatze Automatikoan (RSA) aski ezagunak diren bi arazo izan ditugu aztergai: (1) Rol multzo ezberdinen egokitasuna praktikan, eta (2) RSArako sistemek darabiltzaten ezaugarri lexikalen eragin mugatua eta pairatzen duten sakabanaketa. Lehen puntuari dagokionez, gaur egun gure arloan gehien erabiltzen diren PropBank eta VerbNeteko rol multzoen azterketa konparatibo sakona aurkeztuko dugu, rol multzo bakoitzarekin entrenatutako sailkatzaileen errendimendua, sendotasuna, eta orokortzeko gaitasuna,esperimentazio ingurune eta domeinu ezberdinetan neurtuz. Bigarren puntuari dagokionez, ezaugarri lexikoek planteatzen dituzten arazoak aztertuko ditugu eta, WordNet eta antzekotasun distribuzionaleko neurriekin sortutako hautapen murriztapenak erabiliz, arazo horien eragina modu esanguratsuan leunduko dugu. In-vitro egindako esperimentuekin, hautapen murriztapen horiek lexikotik eratorritako ezaugarriek baino sailkatze ahalmen handiagoa dutela ikusiko dugu. Azkenik, hautapen murriztapenetatik erauzitako ezaugarriak baliatuz, artearen egoeran dagoen RSA sistema baten errendimendua hobetuko dugu (domeinu barnean eta domeinuz kanpo).

[Eng]This thesis focuses on two well-known open issues in Semantic Role Classi fication (SRC) research: (1) the suitability of diferent role inventories in practice, and (2) the limited in uence and sparseness of lexical features. About the former, we present an empirical comparative study on the use of PropBank vs. VerbNet roles, the two most widely used role inventories, testing the performance diferences for unseen verbs and the robustness for new corpus domains. About the latter, we test the use of automatically learnt selectional preferences as a complement to lexical features, proposing both WordNet-based and distributional similarity based models. We show that all our selectional preference models improve over lexical features in in-vitro experiments, and that the models are complementary. Finally, we show that incorporating features based on selectional preferences, the overall performance of an state-of-the-art SRC system improves both in in-domain and out-of-domain corpora.

Identificador

http://hdl.handle.net/10810/10415

256063

10812

Idioma(s)

eus

Publicador

Servicio Editorial de la Universidad del País Vasco/Euskal Herriko Unibertsitatearen Argitalpen Zerbitzua

Direitos

info:eu-repo/semantics/openAccess

Palavras-Chave #lenguajes de programación #inteligencia artificial #lingüística computacional
Tipo

info:eu-repo/semantics/doctoralThesis