4 resultados para NLP (Natural Language Processing)

em Universidade Federal do Pará


Relevância:

100.00% 100.00%

Publicador:

Resumo:

A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Esta pesquisa teve como objetivo identificar e analisar quais as possíveis dificuldades advindas da linguagem que alunos enfrentam na conversão da língua natural para a linguagem matemática. A investigação foi realizada ao longo do ano letivo de 2008 em classes de Ensino Médio de duas escolas públicas da cidade de Belém, onde foram coletadas informações por meio de registros produzidos pelos alunos em testes e avaliações bimestrais. Para subsidiar a investigação foram utilizadas, como aporte teórico, idéias de Raymond Duval acerca da teoria dos registros de representação semiótica; o conceito de significado ligado a filosofia da linguagem segundo Wittgenstein; algumas considerações feitas por Gottlob Frege sobre a distinção entre sentido e referência assim como algumas idéias do filósofo Gilles-Gaston Granger no que concerne ao problema das significações e do aspecto formal da linguagem matemática. As análises das informações que foram coletadas no decorrer do processo investigativo revelaram que, na perspectiva dos alunos, a conversão da língua natural para a linguagem matemática se depara com quatro tipos de dificuldades: a primeira apontou para o fato de existirem em cada registro de representação de um mesmo objeto matemático, diferentes conteúdos a serem mobilizados; a segunda mostrou que os alunos fracassam ao realizar a conversão da língua natural para a linguagem matemática quando não interpretam corretamente as regras matemáticas implícitas no enunciado de uma situação problema; a terceira surgiu do fato de existirem no texto de uma situação problema, palavras que os alunos não compreendiam o seu significado ou que geravam ambigüidade de sentidos; a quarta surgiu a partir do fato dos alunos não conseguirem compreender o significado matemático das letras utilizadas nos enunciados dos problemas.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

A presente dissertação é o resultado de uma investigação qualitativa que tem como objeto de estudo analisar a interpretação de textos matemáticos e as dificuldades na resolução de problemas de Geometria Plana, a partir de registros produzidos pelos sujeitos pesquisados pertencentes a duas turmas do Curso Técnico Integrado ao Ensino Médio na modalidade de Jovens e Adultos do Instituto Federal de Roraima do ano de 2008; uma turma de Enfermagem e outra de Laboratório. Esta análise foi realizada à luz de teóricos como: Gilles-Gaston Granger e Ludwig Wittgenstein, os quais me fizeram perceber que as "dificuldades" encontradas na aprendizagem da Geometria Plana, segundo os preceitos dos PCNs e observadas nos registros analisados, se dão por meio da complexidade das linguagens apresentadas em sala de aula, tais como: a linguagem natural e a linguagem matemática. Os sujeitos pesquisados apontam "dificuldades" na aprendizagem, quando se deparam com a necessidade de traduzir da linguagem natural para a linguagem matemática, a fim de objetivar por meio da escrita as soluções dos problemas propostos. Essas "dificuldades" podem levá-las ao desestímulo pelo estudo, à desistência e/ou a evasão escolar. Por estes motivos, pretendo com esta pesquisa, encontrar subsídios que possam apontar caminhos para minimizar esta problemática, incentivando-os ao estudo por meio da pesquisa, da leitura diária, de modo que, consigam aprender os conteúdos matemáticos com mais vontade e prazer.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Esta dissertação foi desenvolvida no sentido de contribuir para o ensino e para aprendizagem da Geometria Analítica no ensino superior. Para realizar esta tarefa contamos com o referencial teórico de Raymond Duval - com a teoria dos Registros de Representação Semiótica - em aulas expositivas, atividades em classe e na exploração de um maior número de representações do objeto matemático Vetor. Nosso objetivo foi o de identificar e analisar as dificuldades na produção e no tratamento de representações dos vetores que caracterizam lacunas ao aprendizado do conceito desse objeto. Os sujeitos da pesquisa foram alunos de uma turma de Licenciatura em Matemática da Universidade do Estado do Pará – UEPA, Núcleo Regional do Baixo Tocantins – NURBAT localizado em Moju – PA. A pesquisa foi dividida em etapas, onde na primeira, a turma presenciou aulas teóricas com foco principal no estudo de vetores, explorando as várias representações do objeto bem como as operações básicas; a segunda etapa consistiu na resolução de lista de exercícios (atividades 1 e 2), contendo questões retiradas da indicação bibliográfica da disciplina e a avaliação individual. E por último a análise das resoluções feitas pelos sujeitos. Os instrumentos de coleta de dados envolveram questões de representação de vetores nos registros algébrico, figural e da língua natural, assim como, as conversões entre esses registros. Após analisar as resoluções, estas foram agrupadas por categorias as quais: confusão entre coordenadas de ponto e coordenadas de vetor, dificuldade na aplicação da regra do paralelogramo, dificuldade em identificar vetores iguais e conversão entre registros envolvendo o registro geométrico. Ao final das análises apontamos onde os alunos sentem mais dificuldades de acordo com as peculiaridades dos mesmos nas resoluções apresentadas e ainda, propomos a possibilidade de continuidade da pesquisa sobre o mesmo objeto.