3 resultados para natural language processing

em Universidade Federal do Pará


Relevância:

100.00% 100.00%

Publicador:

Resumo:

A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Esta pesquisa teve como objetivo identificar e analisar quais as possíveis dificuldades advindas da linguagem que alunos enfrentam na conversão da língua natural para a linguagem matemática. A investigação foi realizada ao longo do ano letivo de 2008 em classes de Ensino Médio de duas escolas públicas da cidade de Belém, onde foram coletadas informações por meio de registros produzidos pelos alunos em testes e avaliações bimestrais. Para subsidiar a investigação foram utilizadas, como aporte teórico, idéias de Raymond Duval acerca da teoria dos registros de representação semiótica; o conceito de significado ligado a filosofia da linguagem segundo Wittgenstein; algumas considerações feitas por Gottlob Frege sobre a distinção entre sentido e referência assim como algumas idéias do filósofo Gilles-Gaston Granger no que concerne ao problema das significações e do aspecto formal da linguagem matemática. As análises das informações que foram coletadas no decorrer do processo investigativo revelaram que, na perspectiva dos alunos, a conversão da língua natural para a linguagem matemática se depara com quatro tipos de dificuldades: a primeira apontou para o fato de existirem em cada registro de representação de um mesmo objeto matemático, diferentes conteúdos a serem mobilizados; a segunda mostrou que os alunos fracassam ao realizar a conversão da língua natural para a linguagem matemática quando não interpretam corretamente as regras matemáticas implícitas no enunciado de uma situação problema; a terceira surgiu do fato de existirem no texto de uma situação problema, palavras que os alunos não compreendiam o seu significado ou que geravam ambigüidade de sentidos; a quarta surgiu a partir do fato dos alunos não conseguirem compreender o significado matemático das letras utilizadas nos enunciados dos problemas.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

A presente dissertação é o resultado de uma investigação qualitativa que tem como objeto de estudo analisar a interpretação de textos matemáticos e as dificuldades na resolução de problemas de Geometria Plana, a partir de registros produzidos pelos sujeitos pesquisados pertencentes a duas turmas do Curso Técnico Integrado ao Ensino Médio na modalidade de Jovens e Adultos do Instituto Federal de Roraima do ano de 2008; uma turma de Enfermagem e outra de Laboratório. Esta análise foi realizada à luz de teóricos como: Gilles-Gaston Granger e Ludwig Wittgenstein, os quais me fizeram perceber que as "dificuldades" encontradas na aprendizagem da Geometria Plana, segundo os preceitos dos PCNs e observadas nos registros analisados, se dão por meio da complexidade das linguagens apresentadas em sala de aula, tais como: a linguagem natural e a linguagem matemática. Os sujeitos pesquisados apontam "dificuldades" na aprendizagem, quando se deparam com a necessidade de traduzir da linguagem natural para a linguagem matemática, a fim de objetivar por meio da escrita as soluções dos problemas propostos. Essas "dificuldades" podem levá-las ao desestímulo pelo estudo, à desistência e/ou a evasão escolar. Por estes motivos, pretendo com esta pesquisa, encontrar subsídios que possam apontar caminhos para minimizar esta problemática, incentivando-os ao estudo por meio da pesquisa, da leitura diária, de modo que, consigam aprender os conteúdos matemáticos com mais vontade e prazer.