4 resultados para Linguística - Brasil

em Universidade Federal do Pará


Relevância:

60.00% 60.00%

Publicador:

Resumo:

Analisa os principais problemas teóricos, práticos e metodológicos diretamente relacionados à concepção e elaboração de materiais de ensino da escrita na língua apurinã, uma língua sem tradição escrita. A partir da metodologia de análise de um caso, a pesquisa incluiu a revisão da literatura relevante e análise de dados coletados in loco nas comunidades de língua apurinã. Os problemas são identificados e as soluções propostas foram implementadas na elaboração do material didático resultante, "Escrevendo em apurinã". Esse material foi elaborado por mim em co-autoria com o indivíduo apurinã Norá, falante nativo da língua, com o objetivo de apresentar de maneira didática o alfabeto da língua apurinã. Descreve como esse material foi desenvolvido, quais foram as dificuldades encontradas durante a elaboração do livro, quais foram os critérios considerados na sequenciação e organização dos conteúdos, além de apresentar as dificuldades encontradas pelos professores em entender e utilizar esse material nas suas aulas, quais soluções foram encontradas para cada problema. Mostra também como esse material de cunho didático/pedagógico pode contribuir no processo de revitalização da língua apurinã, uma língua minoritária, quase sem nenhum prestígio social e falada pela minoria dos apurinã.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

O objetivo principal dessa Dissertação de Mestrado é caracterizar a variação prosódica dialetal do português falado no município de Abaetetuba (PA). Todos os procedimentos metodológicos adotados, aqui, neste estudo, seguem as orientações estabelecidas pela equipe do Projeto AMPER, na condução do tratamento dos dados, para a confecção do Atlas Prosódico Multimídia das Línguas Românicas. As produções linguísticas dos falantes foram gravadas usando um único padrão, garantindo uma produção do sinal acústico de qualidade uniforme e uma boa representatividade da variedade dialetal. O corpus é constituído de 102 frases, SVC (sujeito + verbo + complemento) e suas expansões (sintagma adjetival e preposicionado), estruturadas com as mesmas restrições fonéticas e sintáticas. Cada uma das sentenças foi repetida seis vezes, por cada um dos quatro informantes, e o corpus total é composto por 612 frases. O pitch, para os informantes do sexo masculino, está entre 50 Hz e 250 Hz; e 110 Hz a 370 Hz para os informantes do sexo feminino. Foram utilizados três parâmetros acústicos controlados: a Frequência fundamental (F0), a Duração (ms) e a Intensidade (dB). O tratamento dos dados foi realizado por meio de sete etapas: 1) codificação das repetições, 2) isolamento de cada sentença em áudio individual; 3) segmentação fonética realizado no software PRAAT; 4) aplicação do PRAAT script; 5) seleção das três melhores repetições; 6) aplicação da interface MATLAB; e 7) utilização do EXCEL para gerar os gráficos para análise comparativa dos dados. Os resultados mostram que “as três maiores variações dos parâmetros acústicos controlados ocorrem preferencialmente na sílaba tônica da parte central do sintagma e/ou no sintagma final do enunciado” (CRUZ; BRITO, 2011).

Relevância:

30.00% 30.00%

Publicador:

Resumo:

A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

O presente trabalho teve como objetivo principal caracterizar a variação prosódica dialetal do português falado na zona rural da cidade de Belém (PA), distrito de Mosqueiro. A pesquisa de campo foi feita com base na metodologia utilizada pelo projeto AMPER, com o corpus constituído de 102 frases, obedecendo às mesmas restrições fonético-sintáticas. Dessa forma, as frases utilizadas nas gravações para a composição do corpus da zona rural de Belém analisadas neste trabalho são do tipo SVC (Sujeito + Verbo + complemento) e suas expansões com a inclusão de Sintagmas Adjetivais e Adverbiais. As sentenças do corpus têm 10, 13 e 14 vogais, sendo que os dois últimos tipos apresentam sintagma com extensão adjetival ou adverbial, respectivamente, à direita do verbo, como em “O pássaro gosta do Renato nadador” ou “O pássaro gosta do Renato de Mônaco”. Cada sentença foi repetida seis vezes, formando um corpus total de 612 frases por cada informante. Os parâmetros acústicos utilizados foram: a duração, a frequência fundamental e a intensidade. A análise dos parâmetros foi feita por meio de dados gerados nos aplicativos PRAAT, Interface MatLab e gráficos gerados no Excel. A pesquisa reuniu dados referentes a seis informantes adultos, de ambos os sexos, com nível de escolaridade fundamental, médio e superior. Os resultados forneceram um desenho entoacional comparativo entre as frases declarativas e interrogativas, além de breves observações sobre o comportamento das vogais pretônicas, postônicas e tônicas, de acordo com as estruturas acentuais e das palavras em diferentes posições frásicas. O foco foi direcionado para o Sintagma Nominal Final e suas extensões sobre o qual verificamos que a sentença interrogativa inicia sua curva melódica baixa em decorrência do pico entoacional no verbo “gosta”, e posterior ascendência na sílaba tônica; e a declarativa inicia a curva com ascendência até a pré-tônica e posterior descendência no final do percurso melódico.