826 resultados para linguística textual


Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this thesis we present and evaluate two pattern matching based methods for answer extraction in textual question answering systems. A textual question answering system is a system that seeks answers to natural language questions from unstructured text. Textual question answering systems are an important research problem because as the amount of natural language text in digital format grows all the time, the need for novel methods for pinpointing important knowledge from the vast textual databases becomes more and more urgent. We concentrate on developing methods for the automatic creation of answer extraction patterns. A new type of extraction pattern is developed also. The pattern matching based approach chosen is interesting because of its language and application independence. The answer extraction methods are developed in the framework of our own question answering system. Publicly available datasets in English are used as training and evaluation data for the methods. The techniques developed are based on the well known methods of sequence alignment and hierarchical clustering. The similarity metric used is based on edit distance. The main conclusions of the research are that answer extraction patterns consisting of the most important words of the question and of the following information extracted from the answer context: plain words, part-of-speech tags, punctuation marks and capitalization patterns, can be used in the answer extraction module of a question answering system. This type of patterns and the two new methods for generating answer extraction patterns provide average results when compared to those produced by other systems using the same dataset. However, most answer extraction methods in the question answering systems tested with the same dataset are both hand crafted and based on a system-specific and fine-grained question classification. The the new methods developed in this thesis require no manual creation of answer extraction patterns. As a source of knowledge, they require a dataset of sample questions and answers, as well as a set of text documents that contain answers to most of the questions. The question classification used in the training data is a standard one and provided already in the publicly available data.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Concept inventory tests are one method to evaluate conceptual understanding and identify possible misconceptions. The multiple-choice question format, offering a choice between a correct selection and common misconceptions, can provide an assessment of students' conceptual understanding in various dimensions. Misconceptions of some engineering concepts exist due to a lack of mental frameworks, or schemas, for these types of concepts or conceptual areas. This study incorporated an open textual response component in a multiple-choice concept inventory test to capture written explanations of students' selections. The study's goal was to identify, through text analysis of student responses, the types and categorizations of concepts in these explanations that had not been uncovered by the distractor selections. The analysis of the textual explanations of a subset of the discrete-time signals and systems concept inventory questions revealed that students have difficulty conceptually explaining several dimensions of signal processing. This contributed to their inability to provide a clear explanation of the underlying concepts, such as mathematical concepts. The methods used in this study evaluate students' understanding of signals and systems concepts through their ability to express understanding in written text. This may present a bias for students with strong written communication skills. This study presents a framework for extracting and identifying the types of concepts students use to express their reasoning when answering conceptual questions.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

We address the task of mapping a given textual domain model (e.g., an industry-standard reference model) for a given domain (e.g., ERP), with the source code of an independently developed application in the same domain. This has applications in improving the understandability of an existing application, migrating it to a more flexible architecture, or integrating it with other related applications. We use the vector-space model to abstractly represent domain model elements as well as source-code artifacts. The key novelty in our approach is to leverage the relationships between source-code artifacts in a principled way to improve the mapping process. We describe experiments wherein we apply our approach to the task of matching two real, open-source applications to corresponding industry-standard domain models. We demonstrate the overall usefulness of our approach, as well as the role of our propagation techniques in improving the precision and recall of the mapping task.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

[ES]En este trabajo se estudia el uso de los marcadores del discurso y del asíndeton como medios de articulación textual entre los diversos enunciados que constituyen los "Progumnásmata" de Nicolao. Este estudio permite observar si existen diferencias entre las dos partes que componen la edición de Felten y si el uso de partículas de Nicolao es diferente del que hacen los demás autores de "Progumnásmata".

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Raquel Merino Álvarez, José Miguel Santamaría, Eterio Pajares (eds.)

Relevância:

20.00% 20.00%

Publicador:

Resumo:

[EN]Measuring semantic similarity and relatedness between textual items (words, sentences, paragraphs or even documents) is a very important research area in Natural Language Processing (NLP). In fact, it has many practical applications in other NLP tasks. For instance, Word Sense Disambiguation, Textual Entailment, Paraphrase detection, Machine Translation, Summarization and other related tasks such as Information Retrieval or Question Answering. In this masther thesis we study di erent approaches to compute the semantic similarity between textual items. In the framework of the european PATHS project1, we also evaluate a knowledge-base method on a dataset of cultural item descriptions. Additionaly, we describe the work carried out for the Semantic Textual Similarity (STS) shared task of SemEval-2012. This work has involved supporting the creation of datasets for similarity tasks, as well as the organization of the task itself.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Apresenta resultados que permitam a melhor compreensão dos efeitos do fenômeno da mudança linguística na recuperação da informação que ocorrerá no futuro de longo prazo por pessoas utilizando estados posteriores da língua portuguesa em relação ao estado de língua utilizado na criação dos documentos. O escopo definido compreende documentos de arquivo históricos produzidos contemporaneamente, os quais precisarão ser recuperados através de sistemas informatizados, ao longo do tempo em que serão utilizados os novos estados da língua portuguesa.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Trabalho de investigação das marcas de iconicidade em letras-de-música brasileira que representam os vários Brasis. Análise do córpus com fundamentação semântico-semiótica, endossada pela perspectiva sociolinguística, como ponto de partida para a caracterização dos itens lexicais como ícone, índice ou símbolo, à luz da Teoria da Iconicidade, como identificadores de um espaço sociocultural. A orientação sociolinguística sustenta nossas reflexões acerca da importância da inserção dos diversos usos linguísticos na prática de ensino de língua portuguesa, que precisa acompanhar a vida da linguagem na comunicação cotidiana, com vistas à valorização e à democratização da língua. Ademais, impõe-se reconhecer a heterogeneidade linguística como fator de riqueza da língua. O trabalho de análise consiste em uma metodologia que permite associar o texto a uma imagem com significado representativo das particularidades linguístico-discursivas de uma cultura regional. Os resultados esperados incluem a afirmação da potencialidade linguístico-semiótica da letra-de-música como gênero textual suficiente para a demonstração dos valores socioculturais impressos na língua e, possivelmente, como um gênero de importante valor literário que se pode aproveitar para dinamizar aulas de língua portuguesa

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O presente trabalho conta com cinquenta redações de alunos do curso Pré - vestibular do Sintuperj, que já concluíram o Ensino Médio e, agora, se preparam para fazer o exame de acesso ao ensino superior - vestibular. A abordagem proposta se baseia na análise da referenciação, forma de organização coesiva do texto, especificamente, o encapsulamento anafórico. Para verificar a função discursiva desse fenômeno argumentativo nas redações, a análise foi dividida em duas perspectivas: por um lado, foram investigados os tipos de cadeias de referenciação, designadas como específica, rotulando e contribuindo para a progressão referencial no texto; ou como não específica, simplesmente, retomando e resumindo o conteúdo antecedente, evitando repetições. De outro lado, ampliou-se a análise para os elementos que constituem essas cadeias, verificando como foi realizada a menção ao referente através da manutenção temática. Além disso, foi possível notar como essa manutenção dos dados no texto possibilita a coesão textual e enriquece a argumentação que o aluno faz para defender a sua tese. Portanto, pode-se afirmar que a principal contribuição que esse trabalho oferece para o ensino de língua materna concerne na abordagem do texto a partir de uma perspectiva dos processamentos cognitivos, revelando como os elementos vão sendo construídos nas redações, a partir de componentes culturais e conhecimentos diversos dos alunos, que proporcionam a progressão referencial

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objeto deste estudo é a análise do comportamento da palavra nos discursos de posse dos Presidentes do Supremo Tribunal Federal, tendo como foco o enunciador e o lugar que ocupa no mundo em que constrói seu discurso, quando toma a palavra que lhe é de direito. Verificamos as relações de poder estabelecidas pela palavra e a ação que ela é capaz de realizar: a construção de imagens, a percepção do outro no momento do costuramento discursivo e os ajustamentos necessários entre o eu e o outro para o desenvolvimento da argumentação. Considerando que o poder imanente da palavra política é premissa fundamental para identificar o ethos dos enunciadores discursivos, demos, pois, enfoque ao modo como se dá a sua constituição nesses discursos, tendo em vista a representação histórica, social, linguística e discursiva dos sujeitos enunciadores, cuja identidade individual ou coletiva, bem como a do auditório a que se destina inscreve o binômio língua/sociedade como premissa fundamental para a realização do estudo da estrutura linguística utilizada em sua redação. Analisar os discursos de posse dos presidentes do Supremo Tribunal Federal, nos últimos 47 anos da República no Brasil, permite que apontemos uma das imagens do Poder Judiciário, forjada pelos membros do próprio Poder e o espelhamento inegável entre presidência e presidentes; que observemos as características que os inserem em determinados domínios discursivos e o contrato que confirma a interdependência e relevância de enunciador e auditório para a constituição do ethos de credibilidade nesses discursos, que tratamos como subgênero textual do gênero discurso de posse; que identifiquemos os ajustamentos e interação entre a tríade enunciador, discurso e auditório responsável pelo desenvolvimento da argumentação e da construção de uma das faces do ethos do Poder Judiciário

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Esta tese tem por objetivo avaliar a contribuição, a nosso ver pioneira, de Othon Moacyr Garcia para os estudos linguísticos, textuais e literários no Brasil. A primeira parte de nosso estudo se concentrará nas principais contribuições dadas pelo livro Comunicação em prosa moderna, cuja primeira edição data de 1967; a segunda parte estudará sua contribuição à crítica literária brasileira, por meio de seus ensaios estilísticos; a terceira parte consistirá num resumo de sua obra dispersa, e a quarta parte também será um resumo das cartas que recebeu e enviou em sua correspondência com escritores e estudiosos da língua e da literatura

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Esta tese tem como objetivo apresentar uma nova atitude diante do ensino de produção de textos. Trata-se do resultado de uma experiência didático-pedagógica cuja meta é deflagrar nos discentes a competência em produção textual. Então, são descritas técnicas que, explorando as várias linguagens e códigos, estimulam os discentes à expressão verbal, em especial, à produção de textos escritos. Baseadas em pressupostos semiótico-linguísticos, as dinâmicas utilizadas nas aulas criam um espaço no qual a produção de textos se dá de forma lúdica, atraente, longe dos bloqueios que normalmente impedem que os alunos sejam proficientes na interação sociocomunicativa e, especificamente, na produção textual escrita em diferentes gêneros textuais. As três técnicas que originaram esta tese integram um conjunto de quinze propostas de atividades reunidas sob o título de Técnicas de Comunicação e Expressão TCE. Tais técnicas buscam desinibir e promover a expressão verbal escrita, em especial. TCE (ou a eletiva Semiótica & Linguagem) surge como um novo paradigma no ensino de produção de textos, trazendo, para os futuros professores, elementos motivadores para a prática textual, de forma a dinamizar esse momento que, quase sempre, é sinônimo de tortura, medo, insegurança e, consequentemente, fracasso

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Nesta tese apresentamos um itinerário de ensino em que o conteúdo gramatical é um meio para o desenvolvimento da consciência linguística e da competência discursivo-textual. Partindo do repertório do falante, nossa investigação tomou o neologismo formado por amálgama lexical como objeto semiótico, realizou uma revisão dos estudos sobre a criação de novas palavras, sua motivação e seus efeitos na comunicação. O neologismo por amálgama lexical foi observado como produto da competência linguística do falante, resultado da exploração das possibilidades do sistema linguístico e emoldurado pela habilidade estilístico-discursiva dos sujeitos. Essa habilidade materializa-se em signos cujos valores icônicos e funcionais dão suporte a uma expressão o mais transparente possível, e as criações amálgamas são formas ricas porque trazem em si marcas dos falantes que as criam/usam, dos segmentos sociais a que estes pertencem e da inexorável evolução da língua em consonância com a evolução da sociedade. Estudos lexicológicos, repertório discente, neologismos inventados pela Turma do Casseta & Planeta e por sua criatura-ficcional -- o repórter Agamenon -- permitiram-nos descrever o fenômeno da neologia por amálgama lexical, sua natureza sistêmico-funcional, suas adaptações morfofonológicas, seus ganhos semânticos e seus aspectos expressivos e impressivos. Apresentamos um modelo de estudo que se quer mais atualizado e dinâmico e que foi testado e comprovado nas turmas do colégio estadual em que atuo como docente do ensino médio

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Este trabalho visa ao estudo da dinamicidade linguística do português contemporâneo, por meio da observação de neologismos lexicais coletados na imprensa escrita. Levando em consideração o aspecto ideológco da linguagem, busca acompanhar a atuação do falante em relação à produção de novas palavra, os motivos pelos quais surgem e o grau de resistência ao seu uso. Objetiva analisar os principais processos de formação de vocábulos em língua portuguesa e identificar os mais produtivos no âmbito do corpus. Ademais, pretende demonstrar as etapas distintas dos processos de inovação e adoção dos neologismos, sobre os quais incidem vários fatores de ordem social, ressaltando a importância da contextualização do vocábulo, cujo exame deve ocorrer sempre à luz dos aspectos discursivos. E, como objetivo último, busca analisar até que ponto as mudanças vivenciadas pela sociedade brasileira estão se refletindo em nossa língua