16 resultados para Português Brasileiro

em Universidade Federal do Pará


Relevância:

100.00% 100.00%

Publicador:

Resumo:

O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Sistema Texto-Fala (TTS) é atualmente uma tecnologia madura que é utilizada em muitas aplicações. Alguns módulos de um sistema TTS são dependentes do idioma e, enquanto existem muitos recursos disponíveis para a língua inglesa, os recursos para alguns idiomas ainda são limitados. Este trabalho descreve o desenvolvimento de um sistema TTS completo para português brasileiro (PB), o qual também apresenta os recursos já disponíveis. O sistema usa a plataforma MARY e o processo de síntese da voz é baseado em cadeias escondidas de Markov (HMM). Algumas das contribuições deste trabalho consistem na implementação de silabação, determinação da sílaba tônica e conversão grafema-fonema (G2P). O trabalho também descreve as etapas para a organização dos recursos desenvolvidos e a criação de uma voz em PB junto ao MARY. Estes recursos estão disponíveis e facilita a pesquisa na normalização de texto e síntese baseada em HMM par o PB.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Este trabalho tem como objetivo observar, descrever e analisar aspectos (inter)culturais em livros didáticos (LDs) de português para estrangeiros a fim de contribuir para o desenvolvimento de procedimentos didáticos-metodológicos suscetíveis de otimizar a aprendizagem da língua portuguesa. Foram analisados cinco livros didáticos de ensino do português para estrangeiros produzidos no Brasil. A metodologia utilizada é a análise de livros didáticos usando os parâmetros culturais propostos por Byram (1993) e os princípios interculturais propostos por Kramsch (1993). Os dados foram analisados tanto qualitativa como quantitativamente. Com relação à análise qualitativa, os referenciais (inter)culturais foram identificados e analisados tendo por base a adequação a uma abordagem de ensino que leve em conta a formação do aprendente em uma dimensão (inter)cultural. Existem várias atividades que podem levar os alunos a desenvolverem uma competência (inter)cultural. Com relação à análise quantitativa, existe certo desequilíbrio entre os livros didáticos, enquanto uns possuem considerável frequência de atividade com enfoque cultural, outros possuem fraca frequência. Conclui-se que os elementos (inter)culturais podem enriquecer o processo de ensino-aprendizagem de uma língua estrangeira – neste caso do português do Brasil – e colaborar para que o aprendente amplie sua percepção da realidade cultural de origem e estrangeira. Quanto mais diversificadas e relevantes forem as atividades em manuais de PLE, mais instrumentos os professores e alunos poderão ter a sua disposição para desenvolver a dimensão (inter)cultural no processo de ensino-aprendizagem.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Este trabalho visa propor uma solução contendo um sistema de reconhecimento de fala automático em nuvem. Dessa forma, não há necessidade de um reconhecedor sendo executado na própria máquina cliente, pois o mesmo estará disponível através da Internet. Além do reconhecimento automático de voz em nuvem, outra vertente deste trabalho é alta disponibilidade. A importância desse tópico se d´a porque o ambiente servidor onde se planeja executar o reconhecimento em nuvem não pode ficar indisponível ao usuário. Dos vários aspectos que requerem robustez, tal como a própria conexão de Internet, o escopo desse trabalho foi definido como os softwares livres que permitem a empresas aumentarem a disponibilidade de seus serviços. Dentre os resultados alcançados e para as condições simuladas, mostrou-se que o reconhecedor de voz em nuvem desenvolvido pelo grupo atingiu um desempenho próximo ao do Google.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

Trata o presente estudo da produção das fricativas interdentais da língua inglesa por falantes do português brasileiro (PB), aprendizes de Inglês como língua estrangeira, (English as a Foreign Language – EFL) nos Cursos Livres de Línguas Estrangeiras mantidos pela Universidade Federal do Pará. O objetivo deste estudo é investigar as possibilidades de ocorrência de substituições para as fricativas interdentais surda e sua contraparte sonora em posições de onset e coda silábica, os resultados são analisados com base na Fonologia de Geometria de Traços (Clements e Hume, 1995). A coleta de dados foi realizada junto a um grupo de vinte e dois alunos, sendo 12 alunos do terceiro nível e 10 alunos do sétimo nível. Pretende-se fazer a representação detalhada do processo de substituição que falantes do português brasileiro (PB), aprendizes de inglês como segunda língua (ESL), realizam especificamente para os segmentos fricativos interdentais da língua inglesa em suas versões surda e sonora /Ɵ/ e /ð/, no processo de aquisição da fonologia desta língua. Diferentes tipos de segmentos foram encontrados em nossa pesquisa como resultado das substituições, quais sejam: [t],[tʃ],[d],[f] e [s] para a fricativa interdental surda /Ɵ/ e [t],[d],[s],[f],[v] e [tʃ] para a fricativa interdental sonora /ð/. Os tipos predominantes de processos observados foram: (a) Fortição, (b) Posteriorização (c) Sonorização (d) Palatalização (e) Labialização (f) Epêntese e (g) Ressilabificação. Todos resultando de um processo anterior chamado Nativização.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

O objetivo principal dessa Dissertação de Mestrado é caracterizar a variação prosódica dialetal do português falado no município de Abaetetuba (PA). Todos os procedimentos metodológicos adotados, aqui, neste estudo, seguem as orientações estabelecidas pela equipe do Projeto AMPER, na condução do tratamento dos dados, para a confecção do Atlas Prosódico Multimídia das Línguas Românicas. As produções linguísticas dos falantes foram gravadas usando um único padrão, garantindo uma produção do sinal acústico de qualidade uniforme e uma boa representatividade da variedade dialetal. O corpus é constituído de 102 frases, SVC (sujeito + verbo + complemento) e suas expansões (sintagma adjetival e preposicionado), estruturadas com as mesmas restrições fonéticas e sintáticas. Cada uma das sentenças foi repetida seis vezes, por cada um dos quatro informantes, e o corpus total é composto por 612 frases. O pitch, para os informantes do sexo masculino, está entre 50 Hz e 250 Hz; e 110 Hz a 370 Hz para os informantes do sexo feminino. Foram utilizados três parâmetros acústicos controlados: a Frequência fundamental (F0), a Duração (ms) e a Intensidade (dB). O tratamento dos dados foi realizado por meio de sete etapas: 1) codificação das repetições, 2) isolamento de cada sentença em áudio individual; 3) segmentação fonética realizado no software PRAAT; 4) aplicação do PRAAT script; 5) seleção das três melhores repetições; 6) aplicação da interface MATLAB; e 7) utilização do EXCEL para gerar os gráficos para análise comparativa dos dados. Os resultados mostram que “as três maiores variações dos parâmetros acústicos controlados ocorrem preferencialmente na sílaba tônica da parte central do sintagma e/ou no sintagma final do enunciado” (CRUZ; BRITO, 2011).

Relevância:

70.00% 70.00%

Publicador:

Resumo:

O presente trabalho teve como objetivo principal caracterizar a variação prosódica dialetal do português falado na zona rural da cidade de Belém (PA), distrito de Mosqueiro. A pesquisa de campo foi feita com base na metodologia utilizada pelo projeto AMPER, com o corpus constituído de 102 frases, obedecendo às mesmas restrições fonético-sintáticas. Dessa forma, as frases utilizadas nas gravações para a composição do corpus da zona rural de Belém analisadas neste trabalho são do tipo SVC (Sujeito + Verbo + complemento) e suas expansões com a inclusão de Sintagmas Adjetivais e Adverbiais. As sentenças do corpus têm 10, 13 e 14 vogais, sendo que os dois últimos tipos apresentam sintagma com extensão adjetival ou adverbial, respectivamente, à direita do verbo, como em “O pássaro gosta do Renato nadador” ou “O pássaro gosta do Renato de Mônaco”. Cada sentença foi repetida seis vezes, formando um corpus total de 612 frases por cada informante. Os parâmetros acústicos utilizados foram: a duração, a frequência fundamental e a intensidade. A análise dos parâmetros foi feita por meio de dados gerados nos aplicativos PRAAT, Interface MatLab e gráficos gerados no Excel. A pesquisa reuniu dados referentes a seis informantes adultos, de ambos os sexos, com nível de escolaridade fundamental, médio e superior. Os resultados forneceram um desenho entoacional comparativo entre as frases declarativas e interrogativas, além de breves observações sobre o comportamento das vogais pretônicas, postônicas e tônicas, de acordo com as estruturas acentuais e das palavras em diferentes posições frásicas. O foco foi direcionado para o Sintagma Nominal Final e suas extensões sobre o qual verificamos que a sentença interrogativa inicia sua curva melódica baixa em decorrência do pico entoacional no verbo “gosta”, e posterior ascendência na sílaba tônica; e a declarativa inicia a curva com ascendência até a pré-tônica e posterior descendência no final do percurso melódico.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

O estudo aqui empreendido sobre o Simbolismo sonoro no Português Brasileiro foi um desafio. Principalmente, pelas parcas referências sobre o assunto na língua portuguesa. Tal processo ainda não foi estudado, com particular inclinação no Português brasileiro, mas, entre poucos, alguns estudos existentes podem ser encontrados em outras línguas, como: bengali (DIMOCK, 1957), Bini (WESCOTT, 1973), koreano (LEE, 1992), na variedade do inglês falado em Singapura (LIM, 1998) e japonês (TAKEMOTO 1998). O atual estudo propõe-se a verificar a presença de ideofônes no Português brasileiro, a partir de dados do falar paraense. Porém, se faz necessário um estudo amplo e integrado que contemple uma descrição do processo no falar de todas as regiões brasileiras.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Este artigo trata essencialmente de uma apresentação das ações do projeto institucional Norte Vogais vinculado ao Diretório Nacional PROBRAVO. O artigo fornece uma ideia precisa de como a equipe da UFPA vinculada ao PROBRAVO está conduzindo suas investigações sobre a variedade do português falada no Pará. O projeto Norte Vogais conta com amostras de fala de trezentos e dezoito informantes nativos do Pará no seu banco de dados. As descrições sociolinguísticas empreendidas pela equipe da UFPA priorizaram a investigação de três aspectos fonéticos em particular: a) a variação das vogais médias pretônicas; b) a variação das vogais médias postônicas mediais e; c) a nasalidade alofônica. Os resultados obtidos reforçam a hipótese de Silva Neto (1957) de que o Pará compreenderia uma ilha dialetal na classificação de Antenor Nascente entre os dialetos do Norte do Brasil. Com o objetivo de refinar as descrições sociolingüísticas, duas novas ações se impuseram: a) o mapeamento da situação sociolinguística das áreas de contato interdialetal no Pará e; b) a análise acústica do sistema vocálico do português falado na Amazônia Paraense.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

O presente estudo visa caracterizar acusticamente o português falado na Amazônia Paraense, tendo como foco as vogais médias pretônicas da variedade linguística falada no município de Barcarena/PA. Esta pesquisa é vinculada ao projeto Norte Vogais, integrante do PROBRAVO, que tem como um de seus objetivos analisar acusticamente o sistema vocálico átono do Português Brasileiro (PB) falado no estado do Pará. O corpus total é composto por amostras de fala de 18 (dezoito) informantes nativos de Barcarena/PA, estratificados socialmente em sexo (masculino e feminino), faixa etária (15 a 25 anos; 26 a 45 anos e acima de 45 anos) e nível de escolaridade (fundamental, médio e superior). Ao todo, 818 realizações das vogais médias pretônicas orais foram analisadas, sendo 411 anteriores e 407 posteriores. Os dados foram obtidos a partir da leitura de um texto sobre futebol, por meio do qual os informantes selecionados produziram 53 vocábulos contendo as vogais médias em posição pretônica. No tratamento dos dados, foram tomadas medidas de F1 e F2 (Hz) das vogais alvo. Constatou-se, a partir da análise empreendida, que os falantes da variedade estudada dão preferência à manutenção das vogais médias, resultado que corrobora com a hipótese apresentada nos estudos variacionistas realizados pela equipe do projeto Norte Vogais. Além disso, verificou-se que, na fala feminina, em relação às anteriores, a variante alta ocupa quase o mesmo espaço acústico da variante média fechada e as duas mantém uma grande distância da variante média aberta. No caso das posteriores, as mesmas ocupam espaços acústicos bem diferenciados. Em contrapartida, na fala masculina, as variantes anteriores estão bem discriminadas e a variante alta e a média fechada posteriores estão muito próximas, distanciando-se significativamente na variante média aberta posterior. Uma tendência à centralização das vogais também foi observada.