4 resultados para Speech synthesis Data processing

em Universidade Federal do Pará


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Neste trabalho, o método FDTD em coordenadas gerais (LN-FDTD) foi implementado para a análise de estruturas de aterramento com geometrias coincidentes ou não com o sistema de coordenadas cartesiano. O método soluciona as equações de Maxwell no domínio do tempo, permitindo a obtenção de dados a respeito da resposta transitória e de regime estacionário de estruturas diversas de aterramento. Uma nova formulação para a técnica de truncagem UPML em coordenadas gerais, para meios condutivos, foi desenvolvida e implementada para viabilizar a análise dos problemas (LN-UPML). Uma nova metodologia baseada em duas redes neurais artificiais é apresentada para a deteccão de defeitos em malhas de terra. O software FDTD em coordenadas gerais foi testado e validado para vários casos. Uma interface gráfica para usuários, chamada LANE SAGS, foi desenvolvida para simplificar o uso e automatizar o processamento dos dados.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

A presente dissertação tem como objetivo central identificar, mapear e descrever a variação lexical do português falado na zona rural de seis municípios da mesorregião Sudeste Paraense: Curionópolis, Itupiranga, Santana do Araguaia, São Félix do Xingu, São João do Araguaia e Tucuruí. Esta mesorregião apresenta importância considerável no contexto sócio-político-econômico-cultural do Estado do Pará. A pesquisa é orientada pelos pressupostos da dialetologia, sob o método da geolinguística. Este trabalho faz parte do projeto GeoLinTerm, mas com pesquisa específica do eixo do projeto ALiPA. Fizemos o levantamento de alguns trabalhos realizados ao longo dos estudos geolinguísticos. A metodologia utilizada contou com a aplicação de um questionário semântico lexical, adaptado, contendo quatorze campos semânticos, que foi respondido pelos informantes selecionados. Os dados coletados nos seis municípios, objeto da pesquisa, contêm registros de fala de 22 informantes da zona rural da mesorregião Sudeste Paraense, dentro do perfil metodológico estabelecido pelo ALiPA. Após a coleta, fizemos o tratamento dos dados com a seleção, a transcrição, a elaboração de 30 cartas e a descrição dos resultados. Das 256 perguntas do questionário, selecionamos as 30 mais frequentes e com maior variação para serem desenvolvidas nas cartas. Em seguida às cartas, mostramos as ocorrências por localidade, sexo e faixa etária.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

O presente estudo visa caracterizar acusticamente o português falado na Amazônia Paraense, tendo como foco as vogais médias pretônicas da variedade linguística falada no município de Barcarena/PA. Esta pesquisa é vinculada ao projeto Norte Vogais, integrante do PROBRAVO, que tem como um de seus objetivos analisar acusticamente o sistema vocálico átono do Português Brasileiro (PB) falado no estado do Pará. O corpus total é composto por amostras de fala de 18 (dezoito) informantes nativos de Barcarena/PA, estratificados socialmente em sexo (masculino e feminino), faixa etária (15 a 25 anos; 26 a 45 anos e acima de 45 anos) e nível de escolaridade (fundamental, médio e superior). Ao todo, 818 realizações das vogais médias pretônicas orais foram analisadas, sendo 411 anteriores e 407 posteriores. Os dados foram obtidos a partir da leitura de um texto sobre futebol, por meio do qual os informantes selecionados produziram 53 vocábulos contendo as vogais médias em posição pretônica. No tratamento dos dados, foram tomadas medidas de F1 e F2 (Hz) das vogais alvo. Constatou-se, a partir da análise empreendida, que os falantes da variedade estudada dão preferência à manutenção das vogais médias, resultado que corrobora com a hipótese apresentada nos estudos variacionistas realizados pela equipe do projeto Norte Vogais. Além disso, verificou-se que, na fala feminina, em relação às anteriores, a variante alta ocupa quase o mesmo espaço acústico da variante média fechada e as duas mantém uma grande distância da variante média aberta. No caso das posteriores, as mesmas ocupam espaços acústicos bem diferenciados. Em contrapartida, na fala masculina, as variantes anteriores estão bem discriminadas e a variante alta e a média fechada posteriores estão muito próximas, distanciando-se significativamente na variante média aberta posterior. Uma tendência à centralização das vogais também foi observada.