925 resultados para Indexação textual
Resumo:
The past decade had witnessed an unprecedented growth in the amount of available digital content, and its volume is expected to continue to grow the next few years. Unstructured text data generated from web and enterprise sources form a large fraction of such content. Many of these contain large volumes of reusable data such as solutions to frequently occurring problems, and general know-how that may be reused in appropriate contexts. In this work, we address issues around leveraging unstructured text data from sources as diverse as the web and the enterprise within the Case-based Reasoning framework. Case-based Reasoning (CBR) provides a framework and methodology for systematic reuse of historical knowledge that is available in the form of problemsolution
pairs, in solving new problems. Here, we consider possibilities of enhancing Textual CBR systems under three main themes: procurement, maintenance and retrieval. We adapt and build upon the stateof-the-art techniques from data mining and natural language processing in addressing various challenges therein. Under procurement, we investigate the problem of extracting cases (i.e., problem-solution pairs) from data sources such as incident/experience
reports. We develop case-base maintenance methods specifically tuned to text targeted towards retaining solutions such that the utility of the filtered case base in solving new problems is maximized. Further, we address the problem of query suggestions for textual case-bases and show that exploiting the problem-solution partition can enhance retrieval effectiveness by prioritizing more useful query suggestions. Additionally, we illustrate interpretable clustering as a tool to drill-down to domain specific text collections (since CBR systems are usually very domain specific) and develop techniques for improved similarity assessment in social media sources such as microblogs. Through extensive empirical evaluations, we illustrate the improvements that we are able to
achieve over the state-of-the-art methods for the respective tasks.
Resumo:
Relatório de Estágio para a obtenção do grau de Mestre em Educação Pré-escolar e em Ensino do 1º Ciclo do Ensino Básico
Resumo:
O presente trabalho de investigação visa propor uma metodologia de elaboração de uma base de dados terminológica destinada a um público não- -especialista, e surge como resposta à necessidade de transmissão de informação ao consumidor, fruto de falta de – ou parca – compreensão do mesmo, relativa a géneros alimentícios com alegações de saúde disponíveis no mercado: os denominados alimentos funcionais. A proposta metodológica de segmentação e caracterização do processo terminográfico, baseada no modelo desenvolvido por Gouadec, para organização do processo global de tradução, encontra-se organizada em três fases – pré-terminografia, terminografia e pós-terminografia –, e compreende três vertentes de análise – uma vertente conceptual, uma vertente comunicativa e uma vertente textual. Em termos gerais, na fase de pré-terminografia é desenvolvido um trabalho preparatório – de familiarização com a área de especialidade e de delimitação da subárea de especialidade, de identificação dos contextos comunicativos e de constituição de corpora especializados – essencial à subsequente fase executória – fase de terminografia – de elaboração do recurso terminológico. A última fase – fase de pós-terminografia – compreende o desenvolvimento de esforços com vista à aplicação industrial do recurso, assim como a sua posterior constante actualização. Constituem objecto de análise do presente trabalho as duas primeiras fases supramencionadas e as etapas que as constituem. A consideração de três vertentes de análise é, de igual forma, relevante.Tal facto é demonstrado ao longo do processo terminográfico, designadamente a nível da análise das repercussões, na fase de terminografia, de cada uma destas vertentes, consideradas já na fase de pré-terminografia. Com este trabalho de investigação pretendemos demonstrar o papel social da Terminologia, no contributo que pode prestar na divulgação de ciência, concretamente através da apresentação de uma proposta de uma base de dados terminológica sobre alimentos funcionais para o consumidor – a AlF Beta. Do mesmo modo, temos por objectivo contribuir a nível da reflexão teórica e metodológica em Terminologia, nomeadamente no que concerne a sua vertente aplicada, através da elaboração de recursos terminológicos destinados a públicos não-especialistas.
Resumo:
Tese de dout., Literatura, Faculdade de Ciências Humanas e Sociais, Univ. do Algarve, 2003
Resumo:
Tese de doutoramento, Linguística (Linguística Aplicada), Universidade de Lisboa, Faculdade de Letras, 2015
Resumo:
Relatório de Estágio apresentado à Escola Superior de Educação de Lisboa para obtenção de grau de mestre em Ensino do 1.º e do 2.º Ciclo do Ensino Básico
Resumo:
Tese apresentada para cumprimento dos requisitos necessários à obtenção do grau de Doutor em (Linguística – Teoria do Texto)
Resumo:
Tese apresentada para cumprimento dos requisitos necessários à obtenção do grau de Doutor em História, na especialidade de História Medieval
Resumo:
Dissertação apresentada para cumprimento dos requisitos necessários à obtenção do grau de Doutor em Estudos Portugueses, variante de História do Livro e Crítica Textual
Resumo:
Dissertação apresentada para cumprimento dos requisitos necessários à obtenção do grau de Mestre em Consultoria e Revisão Linguística
Resumo:
The long term goal of this research is to develop a program able to produce an automatic segmentation and categorization of textual sequences into discourse types. In this preliminary contribution, we present the construction of an algorithm which takes a segmented text as input and attempts to produce a categorization of sequences, such as narrative, argumentative, descriptive and so on. Also, this work aims at investigating a possible convergence between the typological approach developed in particular in the field of text and discourse analysis in French by Adam (2008) and Bronckart (1997) and unsupervised statistical learning.