102 resultados para PLN
Resumo:
As coleções de Entomolologia Sistemática do Instituto nacional de Pesquisas da Amazônia (INPA) em Manaus, Brasil, no momento, contém aproximadamente 16.350 exemplares de invertebrados e vertebrados identificados, representando 330a espécies e incluindo 692 tipos que foram depositados entre 1940 e 1982 por pesquisadores e associados do Instituto Max-Planck de Limnologia em Plön, Alemanha Ocidental.
Resumo:
This PhD project aims to study paraphrasing, initially understood as the different ways in which the same content is expressed linguistically. We will go into that concept in depth trying to define and delimit its scope more accurately. In that sense, we also aim to discover which kind of structures and phenomena it covers. Although there exist some paraphrasing typologies, the great majority of them only apply to English, and focus on lexical and syntactic transformations. Our intention is to go further into this subject and propose a paraphrasing typology for Spanish and Catalan combining lexical, syntactic, semantic and pragmatic knowledge. We apply a bottom-up methodology trying to collect evidence of this phenomenon from the data. For this purpose, we are initially using the Spanish Wikipedia as our corpus. The internal structure of this encyclopedia makes it a good resource for extracting paraphrasing examples for our investigation. This empirical approach will be complemented with the use of linguistic knowledge, and by comparing and contrasting our results to previously proposed paraphrasing typologies in order to enlarge the possible paraphrasing forms found in our corpus. The fact that the same content can be expressed in many different ways presents a major challenge for Natural Language Processing (NLP) applications. Thus, research on paraphrasing has recently been attracting increasing attention in the fields of NLP and Computational Linguistics. The results obtained in this investigation would be of great interest in many of these applications.
Resumo:
Aquest treball descriu una metodologia per classificar els verbs en català segons el seu comportament sintàctic. L’objectiu és adquirir un nombre reduït de classes bàsiques amb una precisió alta fent servir pocs recursos. Obtenir informació sobre classe sintàctica és un procés llarg i costós, però útil per a moltes tasques de PLN. Presentem com obtenir aquesta informació fent servir només un corpus amb anotació de categoria morfològica. Hem explorat tant tècniques supervisades com no supervisades. Primer presentem els experiments que fan servir un mètode supervisat per distingir automàticament entre verbs transitius i intransitius. El nostre sistema té una taxa d’error del 4,65%. Pel que fa als mètodes no supervisats (clustering), presentem dos experiments. El primer pretén classificar els verbs en transitius, intransitius i verbs que alternen amb la partícula se. El segon experiment té per objectiu fer una subclassificació entre intransitius purs i preposicional. Els resultats són uns coeficients-F de 0.84 i 0.88, respectivament.
Resumo:
Forecasting real-world quantities with basis on information from textual descriptions has recently attracted significant interest as a research problem, although previous studies have focused on applications involving only the English language. This document presents an experimental study on the subject of making predictions with textual contents written in Portuguese, using documents from three distinct domains. I specifically report on experiments using different types of regression models, using state-of-the-art feature weighting schemes, and using features derived from cluster-based word representations. Through controlled experiments, I have shown that prediction models using the textual information achieve better results than simple baselines such as taking the average value over the training data, and that richer document representations (i.e., using Brown clusters and the Delta- TF-IDF feature weighting scheme) result in slight performance improvements.
Resumo:
El present treball vol desenvolupar un sistema capaç de treballar amb conceptes tan actuals i innovadors com poden ser el Processament del Llenguatge Natural (PLN), la Realitat Augmentada i o la geo-localització. Per fer-ho, es pensa en un prototip que ofereixi a l'usuari, de manera dinàmica, la possibilitat d'obtenir, a partir d'una col·lecció de documents i enllaços web i de forma totalment automàtica, un conjunt de punts d'interès amb la seva corresponent geo-localització. A més, permet manipular aquests punts d'interès per tal de visualitzar-los en un mapa o traçar rutes.
Resumo:
Actualmente nadie pone en duda la interrelación de los componentes sintáctico y semántico, y en esta línea las diátesis se han mostrado como un medio eficaz para acceder a la semántica a partir de la sintaxis. En el trabajo que presentamos partimos de la hipótesis de que la semántica verbal condiciona el tipo de estructuras sintagmáticas en que un verbo puede aparecer; asimismo, consideramos que se puede identificar la clase semántica de un verbo en función de las diferentes diátesis en que puede participar. El desarrollo de la investigación requiere, en primer lugar, definir las estructuras de diátesis necesarias para la identificación de las clases semánticas y el establecimiento de los papeles temáticos que caracterizarán cada una de las clases y que permitirán la conexión entre la sintaxis y la semántica. En esta comunicación presentamos la metodología seguida para el establecimiento de las clases verbales de las lenguas implicadas en el proyecto Pirápides, y además aportamos una primera propuesta de organización y especificación de las diátesis generales del español y del catalán.
Resumo:
En este artículo se presenta una clase de predicados, la de cambio, a partir de los elementos que hemos definido como básicos para la descripción del comportamiento verbal (componentes de significado, diátesis y estructura eventual). Se parte de la hipótesis de que los tres aspectos citados interaccionan entre sí y que son fundamentales a la hora de dar cuenta del uso real de los predicados. Esta información ha sido incorporada en la entrada léxica de una base de conocimiento léxico, de la cual presentamos la implementación.
Resumo:
En este artículo presentamos el desarrollo del proyecto SenSem (BFF2003-06456), que tiene como objetivo describir y representar el comportamiento léxico, sintáctico y semántico de los verbos del español. En el desarrollo de este proyecto se están construyendo dos recursos: un corpus de oraciones asociadas a su interpretación sintáctico-semántica y un léxico donde cada sentido verbal se asocia a un conjunto de ejemplos anotados del corpus.
Resumo:
Hemos observado que los tradicionalmente llamados verbos de movimiento comparten unas características sintáctico-semánticas definitorias con otros verbos. En este trabajo hemos definido la clase de los verbos de trayectoria y presentamos una propuesta de representación de la información obtenida a partir del análisis verbal en una base de conocimiento léxico.
Resumo:
En este artículo presentamos el desarrollo de un nuevo recurso de código abierto para el español: el treebank Tibidabo. La anotación se está llevando a cabo de forma semiautomática en la que, en primer lugar, el corpus es analizado automaticamente con una gramática simbólica del español basada en HPSG e implementada en el sistema Linguistic Knowledge Builder, y, en segundo lugar, los resultados del proceso de análisis se desambiguan manualmente. La existencia del treebank Tibidabo nos permitirá futuros trabajos de investigación para el desarrollo y evaluación de una arquitectura híbrida que combine métodos simbólicos y estadísticos para el PLN, así como investigaciones orientadas a la hibridización de técnicas de bajo y alto nivel para el PLN.
Resumo:
La cantata humana per a veu solista a la Península Ibèrica a finals del segle XVII i inicis del XVIII. Estudi i edició musical d'una part del còdex 82 de la Colección Pombalinas de la Biblioteca Nacional de Portugal.
Resumo:
Presentation at Open Repositories 2014, Helsinki, Finland, June 9-13, 2014
Resumo:
The sarcoplasmic reticulum (SR) Ca2+-ATPase (SERCA2a) is under the control of an SR protein named phospholamban (PLN). Dephosphorylated PLN inhibits SERCA2a, whereas phosphorylation of PLN at either the Ser16 site by PKA or the Thr17 site by CaMKII reverses this inhibition, thus increasing SERCA2a activity and the rate of Ca2+ uptake by the SR. This leads to an increase in the velocity of relaxation, SR Ca2+ load and myocardial contractility. In the intact heart, ß-adrenoceptor stimulation results in phosphorylation of PLN at both Ser16 and Thr17 residues. Phosphorylation of the Thr17 residue requires both stimulation of the CaMKII signaling pathways and inhibition of PP1, the major phosphatase that dephosphorylates PLN. These two prerequisites appear to be fulfilled by ß-adrenoceptor stimulation, which as a result of PKA activation, triggers the activation of CaMKII by increasing intracellular Ca2+, and inhibits PP1. Several pathological situations such as ischemia-reperfusion injury or hypercapnic acidosis provide the required conditions for the phosphorylation of the Thr17 residue of PLN, independently of the increase in PKA activity, i.e., increased intracellular Ca2+ and acidosis-induced phosphatase inhibition. Our results indicated that PLN was phosphorylated at Thr17 at the onset of reflow and immediately after hypercapnia was established, and that this phosphorylation contributes to the mechanical recovery after both the ischemic and acidic insults. Studies on transgenic mice with Thr17 mutated to Ala (PLN-T17A) are consistent with these results. Thus, phosphorylation of the Thr17 residue of PLN probably participates in a protective mechanism that favors Ca2+ handling and limits intracellular Ca2+ overload in pathological situations.