873 resultados para português brasileiro
Resumo:
Dissertação (mestrado)—Universidade de Brasília, Instituto de Letras, Departamento de Linguística, Português e Línguas Clássicas, Programa de Pós-Graduação em Linguística, 2015.
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Resumo:
Pós-graduação em Estudos Linguísticos - IBILCE
Resumo:
Pós-graduação em Estudos Linguísticos - IBILCE
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.
Resumo:
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Resumo:
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Trata o presente estudo da produção das fricativas interdentais da língua inglesa por falantes do português brasileiro (PB), aprendizes de Inglês como língua estrangeira, (English as a Foreign Language – EFL) nos Cursos Livres de Línguas Estrangeiras mantidos pela Universidade Federal do Pará. O objetivo deste estudo é investigar as possibilidades de ocorrência de substituições para as fricativas interdentais surda e sua contraparte sonora em posições de onset e coda silábica, os resultados são analisados com base na Fonologia de Geometria de Traços (Clements e Hume, 1995). A coleta de dados foi realizada junto a um grupo de vinte e dois alunos, sendo 12 alunos do terceiro nível e 10 alunos do sétimo nível. Pretende-se fazer a representação detalhada do processo de substituição que falantes do português brasileiro (PB), aprendizes de inglês como segunda língua (ESL), realizam especificamente para os segmentos fricativos interdentais da língua inglesa em suas versões surda e sonora /Ɵ/ e /ð/, no processo de aquisição da fonologia desta língua. Diferentes tipos de segmentos foram encontrados em nossa pesquisa como resultado das substituições, quais sejam: [t],[tʃ],[d],[f] e [s] para a fricativa interdental surda /Ɵ/ e [t],[d],[s],[f],[v] e [tʃ] para a fricativa interdental sonora /ð/. Os tipos predominantes de processos observados foram: (a) Fortição, (b) Posteriorização (c) Sonorização (d) Palatalização (e) Labialização (f) Epêntese e (g) Ressilabificação. Todos resultando de um processo anterior chamado Nativização.
Resumo:
O objetivo principal dessa Dissertação de Mestrado é caracterizar a variação prosódica dialetal do português falado no município de Abaetetuba (PA). Todos os procedimentos metodológicos adotados, aqui, neste estudo, seguem as orientações estabelecidas pela equipe do Projeto AMPER, na condução do tratamento dos dados, para a confecção do Atlas Prosódico Multimídia das Línguas Românicas. As produções linguísticas dos falantes foram gravadas usando um único padrão, garantindo uma produção do sinal acústico de qualidade uniforme e uma boa representatividade da variedade dialetal. O corpus é constituído de 102 frases, SVC (sujeito + verbo + complemento) e suas expansões (sintagma adjetival e preposicionado), estruturadas com as mesmas restrições fonéticas e sintáticas. Cada uma das sentenças foi repetida seis vezes, por cada um dos quatro informantes, e o corpus total é composto por 612 frases. O pitch, para os informantes do sexo masculino, está entre 50 Hz e 250 Hz; e 110 Hz a 370 Hz para os informantes do sexo feminino. Foram utilizados três parâmetros acústicos controlados: a Frequência fundamental (F0), a Duração (ms) e a Intensidade (dB). O tratamento dos dados foi realizado por meio de sete etapas: 1) codificação das repetições, 2) isolamento de cada sentença em áudio individual; 3) segmentação fonética realizado no software PRAAT; 4) aplicação do PRAAT script; 5) seleção das três melhores repetições; 6) aplicação da interface MATLAB; e 7) utilização do EXCEL para gerar os gráficos para análise comparativa dos dados. Os resultados mostram que “as três maiores variações dos parâmetros acústicos controlados ocorrem preferencialmente na sílaba tônica da parte central do sintagma e/ou no sintagma final do enunciado” (CRUZ; BRITO, 2011).