15 resultados para itzulpen-memoriak
Itzulpen automatikorako tresnen egokitzapena euskararako: post-edizioa, ebaluazioa eta aurre-edizioa
Resumo:
Proiektu honetan zehar Itzulpen Automatikoa eta horren inguruko tresnen inguruan jorratu da. Lengoaia Naturalaren Prozesamendua eta itzulpen automatikoa ikasi eta aztertu egin dira ikuspuntu zabal batetik. Itzulpen automatiko orokorraz eta horren aplikazio mota desberdinetatik gain, bestelako kontzeptuak ere tratatu dira, hala nola, itzulpenean laguntzeko tresnak, itzulpen automatikoaren ebaluazioa eta itzulpen automatikorako testuen aurre-edizioa eta post-edizioa. Ikasketa- eta aztertze-prozesu horretaz gain, erlazionatuta dauden tresnak erabili edota moldatu egin dira euskararako itzulpen automatikoan barne. Hiru atal nagusi nabarmendu daitezke: Lehenengo, OmegaT, itzulpenean laguntzeko softwarea, moldatu da Matxin euskararako itzultzaile automatikoa gehituz. Gainera, IXA Taldearen eta Euskal Wikipediaren arteko kolaborazio-lanean, Wikipediako artikuluak eskuratu, itzuli eta igotzeko aukera egokitu zaio OmegaT-ri eta horren erabilera sustatu da Euskal Wikipediako komunitatean eta UPV/EHUko Informatikako ikasle eta irakaslegoaren artean. Bestalde, lan honetaz baliatuz, OmegaT-k sortzen dituen itzulpen-memoriak, Matxin-en itzulpenen gaineko post-edizioan oinarrituak, eskuratzeko modu bat egin da, horiekin Matxin-en funtzionamendua hobetu ahal izateko. Ondoren, Asiya programan integratu egin da euskara. Asiya-k itzulpen automatikoaren ebaluazio eta meta-ebaluazioak egin ditzakeen aplikazioa da. Hainbat metrika aztertu dira euskara aztertzeko balio ote duten begiratzeko. Besteen artean, lau metrikari euskara gehitzeko saiakera egin nahi izan da IXA Taldeko euskarazko testuen analizatzaile batek eskainitako informazio sintaktikoa gehituz, baina bi metrika soilik egokitu ahal izan dira. Azkenik, DiSeg esaldi-segmentatzailea erabili egin da gaztelerazko corpus baten gainean esaldi luzeak banatzeko. Aurre-edizio hori eta gero itzuli egin dira eta Asiya erabiliz emaitzen ebaluazioa eta konparazioa egin dira, esaldi laburragoekin itzulpen automatiko eraginkorragoa lortzen oten den aztertzeko.
Resumo:
Proiektu honetan EBMT tekniken bidez itzulpen partzialak sortzen dituen aurreprozesu batean oinarritutako itzulpen automatikorako hibridazio-mekanismo bat garatu da, entitateen eta esaldia baino txikiagoak diren unitate sintaktikoen bidezko orokortzea darabilena. Sistema oso arina eta eskalagarria izan dadin diseinatua izan da, eta inplementazio modular, hedagarri eta eraginkor bat eskaini zaio, baliabide eta tresna ugarirekin integratuz. Egindako esperimentuetan oso emaitza positiboak eskuratu dira, proposatutako sistemak abiapuntukoarekiko hobekuntza nabarmenak ekar ditzakeela erakusten dutenak.
Resumo:
[EU]Lan honetan, adibideetan oinarritutako patroi batzuk sortu ditugu, erregeletan oinarritutako itzulpen-sistema automatiko bat hobetzeko asmoz. Patroirik erabilgarrienak emango zituzten adibideak bakarrik hartzeko, euren erabilera-maiztasunari eta itzulpen automatikoen egokitasunari erreparatu diegu. Ondoren, adibideetako entitate-izenak eta zenbakiak orokortu ditugu, elementu horiek aldatuta ere, patroiak erabili ahal izateko.
Resumo:
603 p.
Resumo:
Euskararako perpaus-identifikatzailearen sorkuntzaren ondoren, gaztelaniarako perpaus-identifikatzailea sortu nahi izan dugu, itzulpen automatikoan lagungarri izango delakoan. Gaztelaniarako perpaus-identifikatzailea sortzeko ikasketa automatikoko teknikak erabili ditugu.
Resumo:
521 p.
Resumo:
Zelulen bizi zikloan zehar zein inguruneko estimulu edo erasoen aurrean, geneek adierazpenean aldaketak pairatzen dituzte; proteinen sintesia beraz, prozesu dinamikoa da. Proteomikak izugarrizko jauzia suposatu du egoera ezberdinetan sintetizatzen diren proteinen inguruko ezagutzan. Hasiera batean esfortzu gehienak identifikaziora bideratzen ziren arren, azken hamarkadetan identifikazioaz gain, kuantifikazioak indar handia hartu du. Hala izanik, gaur egun ikerkuntza arloan lagin biologiko konplexuetako proteinen identifikazio eta kuantifikazioa bereizmen handiz eta era errepikakorrean burutzeko metodoen behar handia dago. Proteomika diziplina sortu zenetik eta berrikuntza teknologikoek lagunduta, geneen adierazpen mailaren, isoformen eta itzulpen ondoko eraldaketen inguruko geroz eta informazio gehiago lortzen den arren, egunera arte erabilitako metodo guztiek zenbait muga edo traba agertzen dituztela ukaezina da. 2D geletako proteinen analisiarekin hasi eta masa espektrometrian oinarritutako eskala handiko proteomikatik igarota, gaur egun masa espektrometrian oinarritzen den eta puri-purian dagoen proteomika ituratura heldu gara. Azken hurbilketa honek lagin konplexuetan bereizmen eta espezifikotasun handiz, interesekoa den proteina jakin bat edo batzuk identifikatu eta kuantifikatzeko aukera eskaintzen du. Proteomika ituratua SRM (Single Reaction Monitoring) teknikaren eskutik agertu zen arren, gaur egun PRM (Parallel Reaction Monitoring) teknika ari da aurrekoarekiko gailentzen are bereizmen eta sentikortasun handiagoa eskaintzen baitu. Testuingurua hau izanik, aurkezten den lan honetan, Escherichia coliren (E. coli) ClpB proteinaren identifikazioa burutzeko PRM bidezko esperimentu bat diseinatu da. Batetik, proteina honen jarraipena egiteko erabiliko diren peptido proteotipikoen aukeraketa eskala handiko MS/MS esperimentuen bidez zein eskuragarri dauden datu-baseak erabilita burutu daitekeela frogatu da. Bestetik, PRM esperimentua lagin konplexu batekin burutu eta hautatutako peptidoak behatu daitezkeela ikusi da. Are gehiago, lortutako emaitzei erreparatuta, peptidoen aukeraketa esperimentuaren arrakastarako faktore erabakigarria dela ondorioztatu da. Gainera, proiektu honetan aurkezten den lanarekin, orain arteko biokimikako beste teknikek eskatzen duten lan eskerga ekiditen da. Hortaz, PRM teknika lagin konplexuetan inolako frakzionamendu, purifikazio edo aberastasun pausorik gabe intereseko proteina baten kuantifikazioa burutzeko metodo egokia dela frogatu da.
Resumo:
Gaur egun, Botere Judizialaren Lege Organikoaren Erreformatik abiatuta -abenduaren 23ko 19/2003 LOren bidez gauzatua-, hainbat erregelamendu eta araudi sortu dira hizkuntza-normalizaziorako prozesu garrantzitsu bat abiarazteko Justizia Administrazioan. Beraz, aipatzekoa da orain arte eginiko ahalegina ez dela nolanahikoa izan, emaitzak desberdinak izan badira ere hainbat gorabehera medio, eta bereziki nabarmentzekoa da Justizia Administrazioaren zerbitzura diharduten pertsonen konpromisoa euskalduntze-prozesuan eta hizkuntzaren erabilera bultzatzeko ekimenetan. Botere Judizialaren Lege Organikoak irismen juridiko handia du zuzenbide publikoaren esparruen multzoan. Hori horrela, eragina du Konstituzio Zuzenbidean -Estatuaren funtsezko Botere bati eta Botere Judizialaren Kontseilu Nagusia bezalako organo konstituzional bati eragiten dien aldetik-, Zuzenbide Prozesalean -Epaitegien eta Auzitegien antolakuntza eta funtzionamendua erregulatzen duen aldetik- eta baita Administrazio Zuzenbidean ere -erlazio juridiko administratiboak eta administrazio-izaerako prozedurak barne hartzen dituen neurrian, adibidez, Epaileen eta Magistratuen estatutu-araubideari dagozkionak-. Beste ikuspegi batetik, Botere Judizialaren Lege Organikoa erreferentzia da epaileriaren estatutu juridikoan, «Zuzenbide Judiziala» izenez ere ezaguna, hiru eratako funtsezko alderdiak barne hartzen dituena: alderdi subjektiboak -Botere Judizialaren organoak eta Epaileen eta Magistratuen estatutu-araubidea, baita Idazkari Judizialen eta Justizia Administrazioaren zerbitzura diharduten gainerako funtzionario Kidegoen estatutu-araubidea ere-; alderdi objektiboak -Botere Judizialaren gobernua, Jurisdikzioaren hedadura eta mugak, eta Epaileen eta Magistratuen independentzia-; eta azkenik, alderdi formalak -Organo jurisdikzionalen araubide prozesala, ekinbide judizialen iraupena eta forma, eta hainbat gairi dagozkien prozedurak: hautaketa, lanpostuak betetzea, egoera administratiboak, ikuskaritza eta Karrera Judizialeko kideen diziplinaaraubidea eta ikuskapena-. Botere Judizialaren Lege Organikoaren —dokumentu berez luzea -eta haren ondoz ondoko erreformen itzulpenarekin, UPV/EHUko zuzenbideko irakasle-talde baten lan serio eta zorrotza bururatzen da. Lan horretan, itzulpenean espezializatutako hizkuntzalarien laguntza izan dute, itzulpen fidel eta teknikoena egiteko, termino egokienak hautatu eta erabilita.
Resumo:
419 p.
Resumo:
Gaur egun hain erabilia den Twitter aplikazioak badu euskarazko bertsioa, baina bertan idazten diren txioak oraindik ezin dira euskaraz atzitu, ez badira euskaraz itzultzen. Beste hizkuntza nagusietan ordea, Twitter aplikazio berak aukera ematen du hizkuntzaz aldatzeko txioen testua, bere elementu eta propietateak mantenduz. Hori da proiektu honen helburua. Txioetan idatzitako testua euskarara itzultzea, txioen formatua mantenduz. Horretarako Twitterren API-a erabiliko dugu, txio eredu ezberdinak jasotzeko, eta ondoren bertako elementuak desberdindu eta itzultzeko, beharrezkoa den heinean. Besteak beste, traolak, erabiltzaileen aipamenak eta RT-eak (berTxioak) duten eragina testuan eta itzulpenean. Txioen testua normalizatzeko aukera desberdinak inplementatu ditugu programan, Matxin web-zerbitzura bidali aurretik eta ondoren lortzen ditugun emaitzak aztertu. Proiektu honek hasiera batetik erakarri zidan, Twitterren API-a erabiltzeko aukera eskaintzen baitu, eta gaur egun lan mundua ikusirik, honelako API ahaltsu bat erabiltzeak asko balio baitu. Bestalde, Gradu amaierako azken urtean izan nuen itzultzaileen funtzionamenduekin lehenengoz harremana, eta ikasgaia aukerazkoa zenez, ez genuen nahi bezain guztia ikusi. Itzultzaileen munduak ere erakartzen zidanez hartu nuen proiektu hau. Amaitu ondoren, esan dezaket nire kuriositatea asetu dudala eta bai itzulpen automatiko bai Twitter API-ekin aplikazioak sortzeko gai naizela. Nire iritzian erabilera handiko produktu bat lortu dugu proiektu honen bidez. Etorkizunari begira, baliabide gehiago inplementatzeko aukerarekin.
Resumo:
[EU]Lan honetan Ebaluatoia aurkezten da, eskala handiko ingelesa-euskara itzulpen automatikoko ebaluazio kanpaina, komunitate-elkarlanean oinarritua. Bost sistemaren itzulpen kalitatea konparatzea izan da kanpainaren helburua, zehazki, bi sistema estatistiko, erregeletan oinarritutako bat eta sistema hibrido bat (IXA taldean garatuak) eta Google Translate. Emaitzetan oinarrituta, sistemen sailkapen bat egin dugu, baita etorkizuneko ikerkuntza bideratuko duten zenbait analisi kualitatibo ere, hain zuzen, ebaluazio-bildumako azpi-multzoen analisia, iturburuko esaldien analisi estrukturala eta itzulpenen errore-analisia. Lanak analisi hauen hastapenak aurkezten ditu, etorkizunean zein motatako analisietan sakondu erakutsiko digutenak.
Resumo:
506 p., 44 p.
m, s eta k opioide-hartzaileen deskribapena, kokapena eta funtzionaltasuna hozi-zelula maskulinoetan
Resumo:
258 p.
Resumo:
[EU]Lan honetan semantika distribuzionalaren eta ikasketa automatikoaren erabilera aztertzen dugu itzulpen automatiko estatistikoa hobetzeko. Bide horretan, erregresio logistikoan oinarritutako ikasketa automatikoko eredu bat proposatzen dugu hitz-segiden itzulpen- probabilitatea modu dinamikoan modelatzeko. Proposatutako eredua itzulpen automatiko estatistikoko ohiko itzulpen-probabilitateen orokortze bat dela frogatzen dugu, eta testuinguruko nahiz semantika distribuzionaleko informazioa barneratzeko baliatu ezaugarri lexiko, hitz-cluster eta hitzen errepresentazio bektorialen bidez. Horretaz gain, semantika distribuzionaleko ezagutza itzulpen automatiko estatistikoan txertatzeko beste hurbilpen bat lantzen dugu: hitzen errepresentazio bektorial elebidunak erabiltzea hitz-segiden itzulpenen antzekotasuna modelatzeko. Gure esperimentuek proposatutako ereduen baliagarritasuna erakusten dute, emaitza itxaropentsuak eskuratuz oinarrizko sistema sendo baten gainean. Era berean, gure lanak ekarpen garrantzitsuak egiten ditu errepresentazio bektorialen mapaketa elebidunei eta hitzen errepresentazio bektorialetan oinarritutako hitz-segiden antzekotasun neurriei dagokienean, itzulpen automatikoaz haratago balio propio bat dutenak semantika distribuzionalaren arloan.
Resumo:
[EU]Testu bat koherente egiten duten arrazoiak ulertzea oso baliagarria da testuaren beraren ulermenerako, koherentzia eta koherentzia-erlazioak testu bat edo gehiago koherente diren ondorioztatzen laguntzen baitigu. Lan honetan gai bera duten testu ezberdinen arteko koherentziazko 3 Cross Document Structure Theory edo CST (Radev, 2000) erlazio aztertu eta sailkatu dira. Hori egin ahal izateko, euskaraz idatziriko gai berari buruzko testuak segmentatzeko eta beraien arteko erlazioak etiketatzeko gidalerroak proposatzen dira. 10 testuz osaturiko corpusa etiketatu da; horietako 3 cluster bi etiketatzailek aztertu dute. Etiketatzaileen arteko adostasunaren berri ematen dugu. Koherentzia-erlazioak garatzea oso garrantzitsua da Hizkuntzaren Prozesamenduko hainbat sistementzat, hala nola, informazioa erauzteko sistementzat, itzulpen automatikoarentzat, galde-erantzun sistementzat eta laburpen automatikoarentzat. Etorkizunean CSTko erlazio guztiak corpus esanguratsuan aztertuko balira, testuen arteko koherentzia- erlazioak euskarazko testuen prozesaketa automatikoa bideratzeko lehenengo pausua litzateke hemen egindakoa.