Biblioteca Digital

131 resultados para Lingüística aplicada

em Consorci de Serveis Universitaris de Catalunya (CSUC), Spain

Els efectes de la transmissió intergeneracional de la llengua, l'escolarització i la integració lingüística en les previsions de la competència en valencià al País Valencià

Relevância:

70.00% 70.00%

Publicador:

Resumo:

Avaluem la importància relativa dels processos demogràfics i lingüístics en l’evolució de la competència per comprendre, parlar, llegir i escriure català en el País Valencià. Basades en les projeccions d’una vasta sèrie d’escenaris, les anàlisis de regressió múltiple mostren que l’adquisició de la llengua pròpia durant l’escolarització, la immigració i la integració lingüística dels immigrants tenen més pes que altres processos demolingüístics en els efectes a llarg termini dels nivells de competència.

Sistemas de detección y extracción semiautomática de siglas: estado de la cuestión

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Informe de investigación realizado a partir de una estancia en el Équipe de Recherche en Syntaxe et Sémantique de la Université de Toulouse-Le Mirail, Francia, entre julio y setiembre de 2006. En la actualidad existen diversos diccionarios de siglas en línea. Entre ellos sobresalen Acronym Finder, Abbreviations.com y Acronyma; todos ellos dedicados mayoritariamente a las siglas inglesas. Al igual que los diccionarios en papel, este tipo de diccionarios presenta problemas de desactualización por la gran cantidad de siglas que se crean a diario. Por ejemplo, en 2001, un estudio de Pustejovsky et al. mostraba que en los abstracts de Medline aparecían mensualmente cerca de 12.000 nuevas siglas. El mecanismo de actualización empleado por estos recursos es la remisión de nuevas siglas por parte de los usuarios. Sin embargo, esta técnica tiene la desventaja de que la edición de la información es muy lenta y costosa. Un ejemplo de ello es el caso de Abbreviations.com que en octubre de 2006 tenía alrededor de 100.000 siglas pendientes de edición e incorporación definitiva. Como solución a este tipo de problema, se plantea el diseño de sistemas de detección y extracción automática de siglas a partir de corpus. El proceso de detección comporta dos pasos; el primero, consiste en la identificación de las siglas dentro de un corpus y, el segundo, la desambiguación, es decir, la selección de la forma desarrollada apropiada de una sigla en un contexto dado. En la actualidad, los sistemas de detección de siglas emplean métodos basados en patrones, estadística, aprendizaje máquina, o combinaciones de ellos. En este estudio se analizan los principales sistemas de detección y desambiguación de siglas y los métodos que emplean. Cada uno se evalúa desde el punto de vista del rendimiento, medido en términos de precisión (porcentaje de siglas correctas con respecto al número total de siglas extraídas por el sistema) y exhaustividad (porcentaje de siglas correctas identificadas por el sistema con respecto al número total de siglas existente en el corpus). Como resultado, se presentan los criterios para el diseño de un futuro sistema de detección de siglas en español.

Jugant a definir ciència : una eina per treballar amb infants, llenguatge i coneixement especialitzat de manera integrada

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Treball desenvolupat en el marc del projecte "La construcció del coneixement científic: primeres representacions" de l'IULA de la Universitat Pompeu Fabra (Estopà, 2008), l'objectiu principal del qual és desenvolupar una eina que ajudi a mestres i educadors a l'hora de treballar les dues branques fonamentals del coneixement, les ciències i les lletres, de manera simultània, sense oblidar-ne una per afavorir l'altra. Es tracta d'una eina que, des de la lexicologia i la terminologia, a través del joc, ajudi a conceptualitzar correctament termes de ciència, els dessacralitzi i atregui els infants al coneixement científic.

Del discurso a la lexicografía: propuesta de aplicación para los conectores reformulativos

Relevância:

60.00% 60.00%

Publicador:

Resumo:

This paper aims at defending the necessity of creating applicationsfrom studies on discourse, so that applied linguistics becomes auseful tool for the society. This work explains briefly what reformulation connectors are and it shows the electronic prototype (than can be consulted by internet) of a tool designed to make the work of lexicographerseasy concerning the entrance of connectors in the dictionaries (ALCOR), by making emphasis on the theoretical base on which it is sustained and on the decisions of application that have been taken into account.

El corpus tècnic del IULA: corpus textual especializado plurilingüe

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Corpus constituido desde 1993 hasta la actualidad en el marco del proyecto Corpus del Institut Universitari de Lingüística Aplicada (IULA) de la Universidad Pompeu Fabra. Este proyecto recopila textos escritos en cinco lenguas diferentes (catalán, castellano, inglés, francés y alemán) de las áreas de especialidad de la economía, el derecho,el medio ambiente, la medicina y la informática.

El Corpus de l'IULA: etiquetaris

Relevância:

60.00% 60.00%

Publicador:

Resumo:

El projecte central que es duu a terme a l'Institut Universitari de Lingüística Aplicada (IULA) de la Universitat Pompeu Fabra és el corpus de Llenguatges especialitzats. En el marc d'aquest projecte —que implica cinc dominis d'especialitat (dret, economia, informàtica, medi ambient i medicina) i cinc llengües (català, castellà, francès, anglès i alemany)— s'han desenvolupat dos etiquetaris per a la llengua catalana i castellana. Amb el desenvolupament d'aquests etiquetaris es pretén facilitar l'etapa del processament lingüístic del corpus. En aquest paper es discuteixen, d'una banda, alguns aspectes teòrics relatius a la construcció d'etiquetaris i, de l'altra, es presenten els dos etiquetaris que s'han elaborat a l'IULA.

Descripció quantitativa dels neologismes documentats durant l'any 1995 a la premsa en català

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Descripció dels neologismes de l'Observatori de Neologia documentats a la premsa en català (Avui, Punt Diari, El Temps) de l'any 1995, a partir del recurs de creació que els ha generat: processos formals (derivació, composició, sintagmació, conversió sintàctica, truncació, etc.), processos semàntics i manlleus.

Ontologies: a review

Relevância:

60.00% 60.00%

Publicador:

Resumo:

En aquest paper, analitzem les principals ontologies amb la finalitat de dibuixar un panorama general d'una de les eines més utilitzades en l'estructuració del coneixement. En primer lloc, presentem una àmplia descripció de les cinc ontologies més difoses entre la comunitat científica dedicada a la gestió de la informació. Seguidament, repassem breument algunes de les eines de gestió que s'utilitzen per crear i actualitzar ontologies. I, finalment, presentem algunes conclusions en relació a la selecció d'una ontologia i d'un sistema de gestió per a la seva utilització en el marc dels projectes vigents del grup IULATERM.

Transcription, tagging and coding of bilingual corpora via LIDES

Relevância:

60.00% 60.00%

Publicador:

Resumo:

L'objectiu d'aquest informe és presentar l'aplicació d'una sèrie de propostes sobre transcripció, etiquetatge i codificació a dos corpus: el corpus bilingüe LC (La Canonja (Català-Espanyol)) i el corpus trilingüe CSCD (Code-switching as Communicative Design (Català-Espanyol-Anglès)). Aquestes propostes, que constitueixen l'aportació de l'equip IULA-LIPPS (Language Interaction in Plurilingual and Plurilectal Speakers) al manual de codificació del sistema LIDES (Language Interaction Database Exchange System), adoptat pel grup europeu LIPPS, poden ser útils per transcriure, etiquetar i codificar dades provinents de llengües tipològicament properes i distants.

Sistemes d'extracció automàtica de (candidats a) termes: estat de la qüestió

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Des de l'aparició de TERMINO l'any 1990 fins avui dia s'han portat a terme una sèrie de projectes per dissenyar diferents tipus d'extractors automàtics de terminologia, però malgrat la gran quantitat d'estudis que s'estan realitzant en aquesta línia, els resultats no són del tot satisfactoris. Aquest article presenta una anàlisi dels principals sistemes d'extracció automàtica de terminologia amb la finalitat de dibuixar un panorama general de l'estat de la qüestió. L'estudi comença amb la descripció de diversos sistemes d'extracció de terminologia; en el segon apartat, es comparen els diferents sistemes. L'informe finalitza amb unes conclusions sobre els sistemes analitzats i sobre els criteris que podrien guiar una proposta d'un sistema integrador d'extracció de terminologia.

10 anys del Corpus de l'IULA

Relevância:

60.00% 60.00%

Publicador:

Resumo:

En aquest paper, es presenten els criteris de treball que s'han seguit durant els 10 anys en què s'ha anat constituint el corpus de l'IULA. S'exposa l'estat de les dades del corpus, els recursos lèxics utilitzats per al tractament de les dades (diccionaris i etiquetaris) i les eines constituïdes o adaptades. Es dedica especial atenció a la documentació de la cadena de treball de processament del corpus, des de l'adquisició dels textos en format electrònic fins a la seva incorporació definitiva al corpus.

El Corpus de l'IULA: descripció

Relevância:

60.00% 60.00%

Publicador:

Resumo:

El principal projecte de recerca desenvolupat a l'Institut Universitari de Lingüística Aplicada (IULA) de la Universitat Pompeu Fabra és el projecte de Llenguatges especialitzats, sota el qual s'aglutina la totalitat dels investigadors pertanyents a aquest centre. És en aquest marc de recerca on es duu a terme la constitució d'un corpus plurilingüe (català, castellà, francès, anglès i alemany), especialitzat en les àrees del dret, l'economia, la informàtica, el medi ambient i la medicina. En aquest article es descriuen els criteris que s'han tingut en compte per al disseny d'aquest recurs lingüístic i cada una de les fases de desenvolupament que s'han seguit. El resultat de diferents estadis en el procés d'elaboració del corpus es mostra en un conjunt d'annexos al final de l'article, on s'incorpora, a més, una síntesi de l'estat actual del projecte, periòdicament actualitzada.

Marcatge estructural i morfosintàctic del Corpus Tècnic amb l'estàndard SGML

Relevância:

60.00% 60.00%

Publicador:

Resumo:

L'edició de textos fent ús de mitjans informàtics ha comportat avantatges i inconvenients. Mentre que ha fet molt accessible l'edició acurada de textos també ha provocat tot un seguit de problemes, un del quals és la dificultat de compartir recursos.Per altra banda, la lingüística necessita emprar corpus voluminosos per conèixer amb més precisió i fonament el comportament real del llenguatge. És evident que l'obtenció i consegüent preparació d'un corpus per a la seva explotació esdevé un procés costós en temps i recursos, motiu pel qual és força atractiu i gairebé necessari compartir aquest material de recerca amb altres organitzacions. En aquest treball s'examinen les diferents propostes d'aplicació de l'estàndard SGML (Standard Generalized Markup Language) en la constitució de corpus textuals per a la recerca lingüística, amb èmfasi especial en les solucions proposades a l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra.

A survey on transfer-based approaches to MT using feature structures

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Aquest treball és una revisió d'alguns sistemes de Traducció Automàtica que segueixen l'estratègia de Transfer i fan servir estructures de trets com a eina de representació. El treball s'integra dins el projecte MLAP-9315, projecte que investiga la reutilització de les especificacions lingüístiques del projecte EUROTRA per estàndards industrials.

La variació a l'estàndard de la lateral palatal al català de Mallorca, Menorca i Eivissa

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Anàlisi descriptiva de com la formalitat de l’estàndard influeix en la realització de la lateral palatal. Estudi dels casos de pèrdua de la iodització històrica a partir d’un corpus de mitjans de comunicació mitjançant l’aplicació del programa d’anàlisi multivariable Goldvarb per determinar la influència tant de factors interns (lingüístics) com d’externs (socials i estilístics).

«
1
2
3
4
5
6
7
8
9
»