1000 resultados para Vitalidad lingüística
Resumo:
En aquest paper, analitzem les principals ontologies amb la finalitat de dibuixar un panorama general d'una de les eines més utilitzades en l'estructuració del coneixement. En primer lloc, presentem una àmplia descripció de les cinc ontologies més difoses entre la comunitat científica dedicada a la gestió de la informació. Seguidament, repassem breument algunes de les eines de gestió que s'utilitzen per crear i actualitzar ontologies. I, finalment, presentem algunes conclusions en relació a la selecció d'una ontologia i d'un sistema de gestió per a la seva utilització en el marc dels projectes vigents del grup IULATERM.
Resumo:
L'objectiu d'aquest informe és presentar l'aplicació d'una sèrie de propostes sobre transcripció, etiquetatge i codificació a dos corpus: el corpus bilingüe LC (La Canonja (Català-Espanyol)) i el corpus trilingüe CSCD (Code-switching as Communicative Design (Català-Espanyol-Anglès)). Aquestes propostes, que constitueixen l'aportació de l'equip IULA-LIPPS (Language Interaction in Plurilingual and Plurilectal Speakers) al manual de codificació del sistema LIDES (Language Interaction Database Exchange System), adoptat pel grup europeu LIPPS, poden ser útils per transcriure, etiquetar i codificar dades provinents de llengües tipològicament properes i distants.
Resumo:
Des de l'aparició de TERMINO l'any 1990 fins avui dia s'han portat a terme una sèrie de projectes per dissenyar diferents tipus d'extractors automàtics de terminologia, però malgrat la gran quantitat d'estudis que s'estan realitzant en aquesta línia, els resultats no són del tot satisfactoris. Aquest article presenta una anàlisi dels principals sistemes d'extracció automàtica de terminologia amb la finalitat de dibuixar un panorama general de l'estat de la qüestió. L'estudi comença amb la descripció de diversos sistemes d'extracció de terminologia; en el segon apartat, es comparen els diferents sistemes. L'informe finalitza amb unes conclusions sobre els sistemes analitzats i sobre els criteris que podrien guiar una proposta d'un sistema integrador d'extracció de terminologia.
Resumo:
En aquest paper, es presenten els criteris de treball que s'han seguit durant els 10 anys en què s'ha anat constituint el corpus de l'IULA. S'exposa l'estat de les dades del corpus, els recursos lèxics utilitzats per al tractament de les dades (diccionaris i etiquetaris) i les eines constituïdes o adaptades. Es dedica especial atenció a la documentació de la cadena de treball de processament del corpus, des de l'adquisició dels textos en format electrònic fins a la seva incorporació definitiva al corpus.
Resumo:
El principal projecte de recerca desenvolupat a l'Institut Universitari de Lingüística Aplicada (IULA) de la Universitat Pompeu Fabra és el projecte de Llenguatges especialitzats, sota el qual s'aglutina la totalitat dels investigadors pertanyents a aquest centre. És en aquest marc de recerca on es duu a terme la constitució d'un corpus plurilingüe (català, castellà, francès, anglès i alemany), especialitzat en les àrees del dret, l'economia, la informàtica, el medi ambient i la medicina. En aquest article es descriuen els criteris que s'han tingut en compte per al disseny d'aquest recurs lingüístic i cada una de les fases de desenvolupament que s'han seguit. El resultat de diferents estadis en el procés d'elaboració del corpus es mostra en un conjunt d'annexos al final de l'article, on s'incorpora, a més, una síntesi de l'estat actual del projecte, periòdicament actualitzada.
Resumo:
L'edició de textos fent ús de mitjans informàtics ha comportat avantatges i inconvenients. Mentre que ha fet molt accessible l'edició acurada de textos també ha provocat tot un seguit de problemes, un del quals és la dificultat de compartir recursos.Per altra banda, la lingüística necessita emprar corpus voluminosos per conèixer amb més precisió i fonament el comportament real del llenguatge. És evident que l'obtenció i consegüent preparació d'un corpus per a la seva explotació esdevé un procés costós en temps i recursos, motiu pel qual és força atractiu i gairebé necessari compartir aquest material de recerca amb altres organitzacions. En aquest treball s'examinen les diferents propostes d'aplicació de l'estàndard SGML (Standard Generalized Markup Language) en la constitució de corpus textuals per a la recerca lingüística, amb èmfasi especial en les solucions proposades a l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra.
Resumo:
Aquest treball és una revisió d'alguns sistemes de Traducció Automàtica que segueixen l'estratègia de Transfer i fan servir estructures de trets com a eina de representació. El treball s'integra dins el projecte MLAP-9315, projecte que investiga la reutilització de les especificacions lingüístiques del projecte EUROTRA per estàndards industrials.
Resumo:
Anàlisi descriptiva de com la formalitat de l’estàndard influeix en la realització de la lateral palatal. Estudi dels casos de pèrdua de la iodització històrica a partir d’un corpus de mitjans de comunicació mitjançant l’aplicació del programa d’anàlisi multivariable Goldvarb per determinar la influència tant de factors interns (lingüístics) com d’externs (socials i estilístics).
Resumo:
Aquest article conté una proposta per a la representació de les estructures predicatives (és a dir, dels predicats amb els seus arguments) en els formalismes basats en estructures de trets tipificades. L’article comença amb una discussió dels objectius i del nivell de descripció de la representació que es proprosa; i després se centra en una exemplificació minuciosa de les estructures predicatives de totes les categories majors (verbs, adjectius, preposicions i noms), així com d’algunes relacions de modificació.
Resumo:
Aquest working paper és un estudi preliminar que té com a objectiu analitzar acústicament diverses variables fonètiques amb la finalitat forense d'identificació de parlants: les freqüències dels dos primers formants de la vocal [ə] quan s'utilitza com a falca, la duració dels segments [m] tenint en compte el context sil·làbic i, finalment, l'estudi dels pics de freqüències en les fricatives estridents sordes -[s]- utilitzant l'anàlisi LPC. Els resultats revelen diferències estadísticament significatives entre els parlants.
Resumo:
L'Observatori de Neologia, dirigit per la Dra. M. Teresa Cabré, neix com a grup de recerca l'any 1988 a la Universitat de Barcelona i des de 1994 s'incorpora com a projecte a l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra. L'Observatori de Neologia analitza el fenomen de l'aparició de paraules noves o neologismes en l'ús, tant pel que fa al català com al castellà. Actualment compta amb una base de dades de més de 82.000 ocurrències per al català i de més de 60.000 ocurrències per al castellà procedents de textos escrits i orals de mitjans de comunicació.Aquest volum recull la metodologia establerta des de l’inici del projecte pels membres fundadors de l’Observatori de Neologia - tot i que revisada i actualitzada al llarg dels anys. Aquesta metodologia guia tots els treballs de detecció, selecció, tractament i emmagatzemament de les dades que es duen a terme a l’Observatori.
Resumo:
La informació gramatical més habitual de les entrades en un diccionari es basa quasi exclusivament en consignar la categoria sintàctica dels mots. Aquest plantejament suposa una parcel·lació massa vaga de les unitats lingüístiques, atès que en l'ús i la combinació entre elles hi entren en joc altres característiques, les quals porten a subclassificacions més precises a l'interior de les categories gramaticals. Un plantejament lexicogràfic que presenti un tractament detallat de les categories quant a les seves subclasses possibles és, a més d'útil en l'elaboració de diccionaris per a parlants de llengua estrangera, necessari també en diccionaris per a parlants natius de la llengua si, tal com és de suposar, l'ús que s'espera d'un diccionari va més enllà de la simple consulta del significat dels mots.En aquest article s'analitzen alguns dels punts que cal que els diccionaris tinguin en compte per a la descripció de l'ús real dels adjectius, es revisa quin és el tractament que reben en el diccionari pres com a font de referència (Diccionari de la Llengua Catalana (1994), d'Enciclopèdia Catalana) i s'esbossa una proposta de tractament per poder donar compte d'aquests aspectes. L'interès recau tant en qüestions d'ordre superficial dels constituents (la posició típica de les unitats), com aspectes sintàctics (la capacitat predicativa dels elements, la subcategorització de complements), així com també aspectes de tipus semàntic (la relació entre les denotacions de l'adjectiu i el substantiu, la facultat de graduabilitat dels adjectius).
Resumo:
Aquest article intenta examinar la importància d'un tipus determinat d'obra lexicogràfica per a usuaris estrangers: els diccionaris d'aprenentatge, els quals s'han de caracteritzar bàsicament per una transmissió dels significats assequible. El material recollit pretén repassar el contingut d'aquestes publicacions a la tradició anglosaxona i il·lustrar l'estadi inicial de la pràctica castellana a partir dels mètodes lexicogràfics que existeixen actualment des d'aquest punt de vista. Els resultats d'aquests estudis permeten valorar la importància de la compilació dels vocabularis de definició per intentar potenciar la branca de la lexicografia com a ajuda a la pràctica didàctica de l'aprenentatge de l'espanyol com a segona llengua.
Resumo:
L'Observatori de Neologia, dirigit per la Dra. M. Teresa Cabré, neix com a grup de recerca l'any 1988 a la Universitat de Barcelona i des de 1994 s'incorpora com a projecte a l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra. L'Observatori de Neologia analitza el fenomen de l'aparició de paraules noves o neologismes en l'ús, tant pel que fa al català com al castellà. Actualment compta amb una base de dades de més de 82.000 ocurrències per al català i de més de 60.000 ocurrències per al castellà procedents de textos escrits i orals de mitjans de comunicació.Aquest volum recull la metodologia establerta des de l’inici del projecte pels membres fundadors de l’Observatori de Neologia - tot i que revisada i actualitzada al llarg dels anys. Aquesta metodologia guia tots els treballs de detecció, selecció, tractament i emmagatzemament de les dades que es duen a terme a l’Observatori.
Resumo:
Aquest article examina un aspecte de la informació gramatical que inclouen els diccionaris. En concret, analitza el tractament lexicogràfic que els noms que poden formar part d'un determinant complex han rebut en diversos diccionaris. Són noms que, segons els contextos funcionen com a nucli d'un sintagma nominal o com a nucli d'un sintagma determinant. Els resultats d'aquest estudi demostren que la informació gramatical en aquest tipus de noms en la majoria de diccionaris és molt pobre i fins i tot nul·la. Com a alternativa, el treball proposa un primer disseny d'entrada lexicogràfica prototípica per aquest tipus de noms que al costat de la informació semàntica té en compte la informació gramatical i la informació pragmàtica.