10 resultados para corpusa


Relevância:

20.00% 20.00%

Publicador:

Resumo:

[EUS] Artikulu honetan J. P. Ulibarri idazle okondoarrak 1815an argitaratu zuen "Egunare euskerazkoa erdaraskotik itzuliya" egutegia aurkezten dugu, urteetan galdutzat jo izan dena. Lan honetan, orain arte euskal bibliografoek "Egunare"-az esan dutena laburtu dugu (§1), eta horrekin batera alearen deskribapena eskaini dugu bai fisikoa eta baita gaien arabera(§2). Hirugarren atalean(§3), libarriren egiletasuna bermatu dugu: testua egile izenik gabe argitaratu bazen ere albaitariaren lantzat jo dugu, bere idaztankera eta euskara moldea aztertzeko lan honek duen garrantzia azpimarratuz. Amaitzeko, testua bera eskaini dugu, bai edizio erdipaleografiko legez eta baita faksimile eran.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

[EUS] Lan honek Erdi Aroko euskararen ezagutzan sakontzeko ekarpena izan nahi du. Horretarako, garai hartako agirietan eta bestelakoetan agertzen diren hainbat lekukotasun bildu ditugu, bereziki leku eta pertsona izenak. Hauetarik batzuk lehendik ezagunak ziren Lacarrak (1957), Arzamendik (1985), Libanok (1995-1999) edo beste ikerlariek egindako lanei esker; guk honakoan guztiak biltzen saiatu gara, argitaragabe batzuk ere ekarri ditugu eta alfabetikoki hurrenkeratu ditugu eta intereseko datuak (urtea, herria, herrialdea, iturria eta bibliografia) eman ditugu. Bestalde, Erdi Aroko hilarrietan lekukotzen diren hilartitzetako euskarazko elementuak ere jaso eta aztertu ditugu.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In this article we describe the methodology developed for the semiautomatic annotation of EPEC-RolSem, a Basque corpus labeled at predicate level following the PropBank-VerbNet model. The methodology presented is the product of detailed theoretical study of the semantic nature of verbs in Basque and of their similarities and differences with verbs in other languages. As part of the proposed methodology, we are creating a Basque lexicon on the PropBank-VerbNet model that we have named the Basque Verb Index (BVI). Our work thus dovetails the general trend toward building lexicons from tagged corpora that is clear in work conducted for other languages. EPEC-RolSem and BVI are two important resources for the computational semantic processing of Basque; as far as the authors are aware, they are also the first resources of their kind developed for Basque. In addition, each entry in BVI is linked to the corresponding verb-entry in well-known resources like PropBank, VerbNet, WordNet, Levin’s Classification and FrameNet. We have also implemented several automatic processes to aid in creating and annotating the BVI, including processes designed to facilitate the task of manual annotation.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Behar honen helburua Dimako kultura ondarean oinarritutako ahozko literatura batzea eta hori eskolan aplikatzeko jarduera didaktikoen bidezko proposamena egitea da.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In this report we present the results obtained analysing the use, frequency of use and the position of adverbial clauses. This analysis has been performed in the Basque Dependency Treebank (BDT). We also have used the descriptive grammars of Euskaltzaindia, the Royal Academy of the Basque.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

I. Sarrera: 1. Ikerketaren helburua. 2. Aurrekariak. 3. Corpusaren justifikazioa. 4. Ikerlanaren marko teoriko-metodologikoa eta eleberriek lantzen dituzten ardatz tematikoak. 5. Ikerlanaren atalak. II. Memoria eta modus autobiografikoa: 1. Sarrera. 2. Memoria ardatz tematiko, eta modus autobiografikoa kontamolde. 3. Landuko den corpusa eta haren justifikazioa. 4. Espazio femeninoaren sorkuntza idazketan izaten den joera autobiografikoa. 5. Kapitulu honetan aztertu diren nobelen ezaugarriak. 6. Pertsonaien aurkezpena (krisialditik jaiotako pertsonaiak). 7. Ondorioak. III. Genero indarkeria: 1. Sarrera. 2. Kapitulu honetan landuko diren nobelak. 3. Indarkeria ikuspegi soziologikotik. 4. Narratologiatik pertsonaiak aztertzen. 5. Indarkeria sinbolikoaren neurketa semantikoa. 6. Ondorioak. IV. Amatasunaren inguruko diskurtsoak: 1. Sarrera. 2. Amatasunaren inguruko datu soziologikoak. 3. Landuko diren nobelak. 4. Corpuseko eleberriak: amatasunaren kontrako jarrerak. 5. Amatasunaren aldeko aldarria egiten duten corpuseko eleberriak. 6. Emakumeen arteko genealogiak eta ama-alaben arteko harremanak. 7. Ondorioak. V. Ondorio orokorrak: 1. Pertsonaia protagonista femeninoen bilakaera. 2. Emakume berria. 3. Pertsonaia berri horren eraikuntza. VI. Bibliografia.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

[EU]Hizkuntzaren prozesamenduan testu koherenteetan kausa taldeko erlazioak (KAUSA, ONDORIOA eta HELBURUA) automatikoki hautematea eta bereiztea erabilgarria da galdera-erantzun automatikoko sistemak eraikitzerako orduan. Horretarako Egitura Erretorikoaren Teoria (Rhetorical Structure Theory, aurrerantzean RST) eta bere erlazioak erabiliko ditugu, corpus bezala RST Treebank -a (Iruskieta et al., 2013) hartuta, zientziako laburpen-testuz osatutako corpusa, hain zuzen ere. Corpus hori XML formatuan deskargatu eta hortik XPATH tresnaren bidez informazio garrantzitsuena eskuratzen dugu. Lan honek 3 helburu nagusi ditu: lehendabizi, kausa taldeko erlazioak elkarren artean bereiztea, bigarrenez, kausa taldeko erlazio hauek beste erlazio guztiekin bereiztea, eta azkenik, EBALUAZIOA eta INTERPRETAZIOA erlazioak bereiztea sentimendu analisian aplikatu ahal izateko. Ataza horiek egiteko, RhetDB tresnarekin eskuratu diren patroi ensaguratsuenak erabili eta bi aplikazio garatu ditugu. Alde batetik, bilatu nahi ditugun patroiak adierazi eta erlazio-egitura duen edonolako testuetan bilaketak egiten dituen bilatzailea, eta bestetik, patroi esanguratsuenak emanda erlazioak etiketatzen dituen etiketatzailea. Bi aplikazio hauek gainera, ahalik eta modu parametrizagarrienean erabiltzeko garatu ditugu, kodea aldatu gabe edonork erabili ahal izateko antzeko atazak egiteko. Etiketatzaileak ebaluatu ondoren, identifikatzeko erlaziorik errazena HELBURUA erlazioa dela ikusi dugu eta KAUSA eta ONDORIOA bereizteko arazo gehiago dauzkagula ere ondorioztatu dugu. Modu berean, EBALUAZIOA eta INTERPRETAZIOA ere elkarren artean bereiz dezakegula ikusi dugu.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

[EU]Testu bat koherente egiten duten arrazoiak ulertzea oso baliagarria da testuaren beraren ulermenerako, koherentzia eta koherentzia-erlazioak testu bat edo gehiago koherente diren ondorioztatzen laguntzen baitigu. Lan honetan gai bera duten testu ezberdinen arteko koherentziazko 3 Cross Document Structure Theory edo CST (Radev, 2000) erlazio aztertu eta sailkatu dira. Hori egin ahal izateko, euskaraz idatziriko gai berari buruzko testuak segmentatzeko eta beraien arteko erlazioak etiketatzeko gidalerroak proposatzen dira. 10 testuz osaturiko corpusa etiketatu da; horietako 3 cluster bi etiketatzailek aztertu dute. Etiketatzaileen arteko adostasunaren berri ematen dugu. Koherentzia-erlazioak garatzea oso garrantzitsua da Hizkuntzaren Prozesamenduko hainbat sistementzat, hala nola, informazioa erauzteko sistementzat, itzulpen automatikoarentzat, galde-erantzun sistementzat eta laburpen automatikoarentzat. Etorkizunean CSTko erlazio guztiak corpus esanguratsuan aztertuko balira, testuen arteko koherentzia- erlazioak euskarazko testuen prozesaketa automatikoa bideratzeko lehenengo pausua litzateke hemen egindakoa.