Aprenentatge automàtic de classes sintàctiques verbals
Contribuinte(s) |
Universitat Pompeu Fabra. Departament de Traducció i Filologia |
---|---|
Data(s) |
31/12/2007
|
Resumo |
Aquest treball descriu una metodologia per classificar els verbs en català segons el seu comportament sintàctic. L’objectiu és adquirir un nombre reduït de classes bàsiques amb una precisió alta fent servir pocs recursos. Obtenir informació sobre classe sintàctica és un procés llarg i costós, però útil per a moltes tasques de PLN. Presentem com obtenir aquesta informació fent servir només un corpus amb anotació de categoria morfològica. Hem explorat tant tècniques supervisades com no supervisades. Primer presentem els experiments que fan servir un mètode supervisat per distingir automàticament entre verbs transitius i intransitius. El nostre sistema té una taxa d’error del 4,65%. Pel que fa als mètodes no supervisats (clustering), presentem dos experiments. El primer pretén classificar els verbs en transitius, intransitius i verbs que alternen amb la partícula se. El segon experiment té per objectiu fer una subclassificació entre intransitius purs i preposicional. Els resultats són uns coeficients-F de 0.84 i 0.88, respectivament. |
Identificador | |
Idioma(s) |
cat |
Direitos |
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original, la universitat i el departament i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (<a href="http://creativecommons.org/licenses/by-nc-nd/2.5/es/">http://creativecommons.org/licenses/by-nc-nd/2.5/es/</a>) |
Palavras-Chave | #Aprenentatge automàtic #Gràmatica comparada i general -- Verb #Llenguatge i llengües -- Adquisició #Lexicografia -- Processament de dades |
Tipo |
info:eu-repo/semantics/article |