558 resultados para Corpora Pedunculata


Relevância:

10.00% 10.00%

Publicador:

Resumo:

In this article we present a hybrid approach for automatic summarization of Spanish medical texts. There are a lot of systems for automatic summarization using statistics or linguistics, but only a few of them combining both techniques. Our idea is that to reach a good summary we need to use linguistic aspects of texts, but as well we should benefit of the advantages of statistical techniques. We have integrated the Cortex (Vector Space Model) and Enertex (statistical physics) systems coupled with the Yate term extractor, and the Disicosum system (linguistics). We have compared these systems and afterwards we have integrated them in a hybrid approach. Finally, we have applied this hybrid system over a corpora of medical articles and we have evaluated their performances obtaining good results.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O presente trabalho cujo Título é técnicas de Data e Text Mining para a anotação dum Arquivo Digital, tem como objectivo testar a viabilidade da utilização de técnicas de processamento automático de texto para a anotação das sessões dos debates parlamentares da Assembleia da República de Portugal. Ao longo do trabalho abordaram-se conceitos como tecnologias de descoberta do conhecimento (KDD), o processo da descoberta do conhecimento em texto, a caracterização das várias etapas do processamento de texto e a descrição de algumas ferramentas open souce para a mineração de texto. A metodologia utilizada baseou-se na experimentação de várias técnicas de processamento textual utilizando a open source R/tm. Apresentam-se, como resultados, a influência do pré-processamento, tamanho dos documentos e tamanhos dos corpora no resultado do processamento utilizando o algoritmo knnflex.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Na elaboração do presente trabalho, que tem como tema “Os manuais de língua portuguesa e o desenvolvimento da expressão oral no ensino secundário de Cabo Verde”, procurou-se investigar, a partir da perspectiva dos manuais de Língua Portuguesa, até que ponto os mesmos podem servir ou não para o desenvolvimento da competência comunicativa dos alunos do ensino secundário, na modalidade de expressão oral. Para isso foi adoptada uma metodologia situada no campo da investigação educacional, sem pôr de lado os métodos da pesquisa qualitativa e quantitativa, o que permitiu abordar as questões relacionadas com as constantes situações de insucesso na aprendizagem da Língua Portuguesa, cujas causas têm sido atribuídas, quase sempre, aos factores como as metodológicas, aos problemas linguísticos, decorrentes da forte presença da língua materna no quotidiano dos aprendentes e ao uso de materiais desajustados da realidade nacional. Assim, para o cumprimento dos objectivos propostos, foi possível trabalhar sobre dois corpora; por um lado analisaram-se os manuais do ensino secundário, por outro, foi examinado o inquérito aplicado tanto aos professores como aos alunos, e cujo tratamento dos dados permitiu confirmar a aceitação entusiástica dos manuais escolares no contexto pedagógico, apesar da descrença na potencialidade dos exercícios propostos em desenvolver a capacidade de expressão oral dos alunos. Outro aspecto digno de registo foi o desejo manifestado pelos informantes em ter outros materiais capazes de melhorar o ensino do Português como língua segunda. Em termos do ensino da citada disciplina, foram apresentadas algumas sugestões para que a sua melhoria reverta a favor do sucesso de aprendizagem de todos os alunos.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Os mecanismos de formação de frases relativas restritivas têm sido amplamente analisados na literatura sobre o português europeu (PE) e o português brasileiro (PB) (e.g. Tarallo 1985; Brito 1991; Kato 1993; Peres & Móia 1995; Kato et al. 1996; Alexandre 2000, Kenedy 2007), focando em particular se há ou não aplicação da operação Move. No entanto, os estudos sobre construções-Q, concretamente sobre relativas restritivas, em variedades (emergentes) do português em África são ainda escassos e restringem-se essencialmente ao português de Moçambique (PM), onde se observa um processo de mudança linguística que parece privilegiar a estratégia resumptiva (Chimbutane 1996; Gonçalves 1996; Gonçalves & Stroud 1998; Brito 2001), como em Nesta comunicação, alargaremos o estudo das frases relativas ao português falado em Cabo Verde e em S. Tomé e Príncipe, baseando-nos em corpora do Centro de Linguística da Universidade de Lisboa (CLUL) descritos na secção 3. O nosso objetivo é mostrar que, nestas variedades, a estratégia canónica de piedpiping (2) convive com diversas estratégias consideradas agramaticais à luz da norma, designadamente a estratégia cortadora (3), que é particularmente comum, e as estratégias resumptiva (4) e de cópia defetiva (5), que ocorrem com menor frequência. Esta última estratégia foi apenas encontrada nos dados do POST.4 (2) Não, houve uma ocasião em que havia muita cólera, ... (POST) (3) a. Esse jornalista Ø que estamos aqui a falar, isento, objectivo... (POCV) b. Depois cheguei um momento Ø que eu vi que era vazio... (POST) (4) Meu filho foi baptizado no católico e a mulher que eu vivo com ela também é católica. (POST) (5) A própria escola que eu estudei nele. (POST) Defenderemos que a preferência pela estratégia cortadora poderá estar relacionada com a reestruturação das grelhas argumentais dos verbos no POST (R. Gonçalves 2010) e que tal facto constitui um contraste com o POCV (assim como com o PE e o PB), variedade em que a presença de relativas cortadoras não está, tipicamente, relacionada com a alteração dessas propriedades nos verbos.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Na elaboração do presente trabalho, que tem como tema “Os manuais de língua portuguesa e o desenvolvimento da expressão oral no ensino secundário de Cabo Verde”, procurou-se investigar, a partir da perspectiva dos manuais de Língua Portuguesa, até que ponto os mesmos podem servir ou não para o desenvolvimento da competência comunicativa dos alunos do ensino secundário, na modalidade de expressão oral. Para isso foi adoptada uma metodologia situada no campo da investigação educacional, sem pôr de lado os métodos da pesquisa qualitativa e quantitativa, o que permitiu abordar as questões relacionadas com as constantes situações de insucesso na aprendizagem da Língua Portuguesa, cujas causas têm sido atribuídas, quase sempre, aos factores como as metodológicas, aos problemas linguísticos, decorrentes da forte presença da língua materna no quotidiano dos aprendentes e ao uso de materiais desajustados da realidade nacional. Assim, para o cumprimento dos objectivos propostos, foi possível trabalhar sobre dois corpora; por um lado analisaram-se os manuais do ensino secundário, por outro, foi examinado o inquérito aplicado tanto aos professores como aos alunos, e cujo tratamento dos dados permitiu confirmar a aceitação entusiástica dos manuais escolares no contexto pedagógico, apesar da descrença na potencialidade dos exercícios propostos em desenvolver a capacidade de expressão oral dos alunos. Outro aspecto digno de registo foi o desejo manifestado pelos informantes em ter outros materiais capazes de melhorar o ensino do Português como língua segunda. Em termos do ensino da citada disciplina, foram apresentadas algumas sugestões para que a sua melhoria reverta a favor do sucesso de aprendizagem de todos os alunos

Relevância:

10.00% 10.00%

Publicador:

Resumo:

By providing a better understanding of paraphrase and coreference in terms of similarities and differences in their linguistic nature, this article delimits what the focus of paraphrase extraction and coreference resolution tasks should be, and to what extent they can help each other. We argue for the relevance of this discussion to Natural Language Processing.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In this paper, we present a critical analysis of the state of the art in the definition and typologies of paraphrasing. This analysis shows that there exists no characterization of paraphrasing that is comprehensive, linguistically based and computationally tractable at the same time. The following sets out to define and delimit the concept on the basis of the propositional content. We present a general, inclusive and computationally oriented typology of the linguistic mechanisms that give rise to form variations between paraphrase pairs.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El objetivo del trabajo es determinar si el uso de un grupo de verbos es propio del español de Argentina o si, por el contrario, se extiende a otros países hispanohablantes. Para ello, se analizan el proceso de derivación verbal, la semántica y el carácter neológico de las voces.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

En este trabajo se estudia la relación entre la morfología y la lexicografía mediante el análisis de seis verbos prefijados con re-. Se comparan sus definiciones en tres diccionarios y se proponen nuevas definiciones siguiendo el modelo de entrada lexicográfica del Diccionario de Aprendizaje de Español como Lengua Extranjera.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In recent decades, technological advances have made extensive documentation available to us. But the philologist must be aware of the dangers of poor use of the documentary corpus in order to avoid creating dreaded ghost words. In this paper we recall the main sources of this type of error: folk etymology phenomena among speakers, copyists" errors, transcribers" errors in the interpretation of some abbreviations and graphic variants of the manuscripts, onomastic changes introduced by cartographers" ignorance of linguistic variants, gaps in the dating of some documents, confusion in the processes of lemmatization and the evaluation of texts... All these sources of error contribute, to a greater or lesser degree, to the distortion or to the masking of the data on which the research of philologists is based. Hence the importance of philological rigour in the transmission and study of ancient texts.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

F. 1-12v. Calendrier d’Autun en français, inscrit à l’or et à l’encre, alternativement rouge et bleue : 1er juin, « s. Reverien » [év. d’Autun] ; 12 juin, en or : « s. Nazaire » [révélation] ; 28 juil., « ss. Nazaire et Celse » ; 4 août, « s. Cassien [év. d’Autun] » ; 1er sept., « s. Ladre » [Lazare] ; 5 sept., «ste Royne » [Reine d’Alise] ; 19 sept., « s. Soigne » [Seine] ; 24 sept., « Andoche » [év. d’Autun] ; 2 oct., « Legier » [év. d’Autun] ; 20 oct., « revelacion s. Ladre » ; 17 déc., « s. Lazaire » ; 20 déc., « s. Nasaire » [21 déc., dédicace de Saint-Nazaire d’Autun]. F. 13-18. Péricopes évangéliques : Io 1, 1-14, suivi du suffrage adressé à l’apôtre ; Mt 2, 1-12 ; Lc 1, 26-38 ; Mc 16, 14-20. Les évangiles de Mathieu et de Luc sont incomplets du début par suite de la perte du premier fol. F. 19-78v. Heures de la Vierge à l’usage de Rome. Les heures de tierce, sexte, none et vêpres sont incomplètes du début par suite de la perte du premier feuillet. F. 79-82v. “Obsecro te…”, prière au masculin (éd. Leroquais, Livres d’heures, II, 347). F. 83-86v. Office de la Croix « De sancta cruce ». F. 87-90v. Office du Saint Esprit « De sancto Spiritu ». F. 91-107v. Psaumes de la pénitence , suivis des Litanies, incomplet du premier feuillet. A noter, parmi les confesseurs, « sancte Ludovice », Louis d’Anjou, év. de Toulouse. F. 107v-154. Office des morts à l’usage de Rome. « In agenda mortuorum ad vesperas ». F. 154v-159. Addition du XVe siècle : « Oraison de saint Sebastien », suffrage ; [Oraison pour les trépassés] « Avete omnes fideles anime quorum corpora… coronemur... Domine Jhesu Christe salus et liberatio animarum... jubeas. Per... » (154v et 159). — Additions du début du XVIe siècle. « Veni creator Spiritus... spiritus. Amen » ; « De s. Johanne Baptista » ; « Salve regina misericordie vita... ostende » ; « Domine non sum digna… animeam meam », à noter la forme féminine (156-158). — Sur le verso du f. 158, a été cousu un petit feuillet de parchemin portant l’oraison « O passio magna, o profunda vulnera, o effusio sanguinis, o dulcis dulcedo, o mortis amaritudo, da michi vitam eternam. Amen. Pater. Ave Maria. Credo ».

Relevância:

10.00% 10.00%

Publicador:

Resumo:

This article introduces EsPal: a Web-accessible repository containing a comprehensive set of properties of Spanish words. EsPal is based on an extensible set of data sources, beginning with a 300 million token written database and a 460 million token subtitle database. Properties available include word frequency, orthographic structure and neighborhoods, phonological structure and neighborhoods, and subjective ratings such as imageability. Subword structure properties are also available in terms of bigrams and trigrams, bi-phones, and bi-syllables. Lemma and part-of-speech information and their corresponding frequencies are also indexed. The website enables users to either upload a set of words to receive their properties, or to receive a set of words matching constraints on the properties. The properties themselves are easily extensible and will be added over time as they become available. It is freely available from the following website: http://www.bcbl.eu/databases/espal

Relevância:

10.00% 10.00%

Publicador:

Resumo:

This article describes the developmentof an Open Source shallow-transfer machine translation system from Czech to Polish in theApertium platform. It gives details ofthe methods and resources used in contructingthe system. Although the resulting system has quite a high error rate, it is still competitive with other systems.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Dels criteris proposats per la bibliogra a per identi car les perífrasis verbals (PV) de l'espanyol, només alguns ajuden a diferenciar amb e càcia les PV de les construccions no perifràstiques (CNP). L'objectiu d'aquest article és revisar aquests criteris i avaluar-los per tal de determinar quins són realment vàlids per identi car les PV. L'avaluació s'ha dut a terme amb un grup de 15 conjunts verbals. A més, s'ha realitzat un estudi experimental amb corpus per determinar la productivitat de les PV detectades.