Biblioteca Digital

6 resultados para Automatic speech recognition (ASR)

em Universidade Federal do Pará

Convers��o grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabul��rios para o portugu��s brasileiro

Relevância:

100.00% 100.00%

Publicador:

Resumo:

O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem autom��tica de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta ��rea est�� diretamente ligado a exist��ncia de corpora de dom��nio p��blico e outros recursos espec��ficos, tal como um dicion��rio fon��tico. No Brasil, ao contr��rio do que acontece para a l��ngua inglesa, por exemplo, n��o existe atualmente em dom��nio p��blico um sistema de Reconhecimento Autom��tico de Voz (RAV) para o Portugu��s Brasileiro com suporte a grandes vocabul��rios. Frente a este cen��rio, o trabalho tem como principal objetivo discutir esfor��os dentro da iniciativa FalaBrasil [1], criada pelo Laborat��rio de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na ��rea de RAV para o Portugu��s do Brasil. Mais especificamente, o presente trabalho discute a implementa��o de um sistema de reconhecimento de voz com suporte a grandes vocabul��rios para o Portugu��s do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a cria��o de um m��dulo de convers��o grafema-fone, utilizando t��cnicas de aprendizado de m��quina.

Veja mais

Classifica��o fon��tica utilizando Boosting e SVM

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Para compor um sistema de Reconhecimento Autom��tico de Voz, pode ser utilizada uma tarefa chamada Classifica��o Fon��tica, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classifica��o e real��ar as caracter��sticas mais marcantes dos fonemas, normalmente, as amostras de voz s��o pr��- processadas atrav��s de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de par��metros para cada amostra de voz. Ap��s este processamento, estes par��metros s��o insendos em um algoritmo classificador que (j�� devidamente treinado) procurar�� decidir qual o fonema emitido. Existe uma tend��ncia de que quanto maior a quantidade de par��metros utilizados no sistema, melhor ser�� a taxa de acertos na classifica��o. A contrapartida para esta tend��ncia �� o maior custo computacional envolvido. A t��cnica de Sele��o de Par��metros tem como fun��o mostrar quais os par��metros mais relevantes (ou mais utilizados) em uma tarefa de classifica��o, possibilitando, assim, descobrir quais os par��metros redundantes, que trazem pouca (ou nenhuma) contribui��o �� tarefa de classifica��o. A proposta deste trabalho �� aplicar o classificador SVM �� classifica��o fon��tica, utilizando a base de dados TIMIT, e descobrir os par��metros mais relevantes na classifica��o, aplicando a t��cnica Boosting de Sele��o de Par��metros.

Veja mais

Ferramentas e recursos livres para reconhecimento e s��ntese de voz em portugu��s brasileiro

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Sistemas de reconhecimento e s��ntese de voz s��o constitu��dos por m��dulos que dependem da l��ngua e, enquanto existem muitos recursos p��blicos para alguns idiomas (p.e. Ingl��s e Japon��s), os recursos para Portugu��s Brasileiro (PB) ainda s��o escassos. Outro aspecto �� que, para um grande n��mero de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda �� elevada, quando comparada �� obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), �� necess��ria a pesquisa por novos m��todos. Este trabalho tem como motiva��o esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e s��ntese de voz em PB, consistindo de bases de dados de ��udio e texto, um dicion��rio fon��tico, um conversor grafema-fone, um separador sil��bico e modelos ac��stico e de linguagem. Todos os recursos constru��dos encontram-se publicamente dispon��veis e, junto com uma interface de programa��o proposta, t��m sido usados para o desenvolvimento de v��rias novas aplica��es em tempo-real, incluindo um m��dulo de reconhecimento de voz para a su��te de aplicativos para escrit��rio OpenOffice.org. S��o apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a ado��o da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela ind��stria. A segunda parte do trabalho apresenta um novo m��todo para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual �� organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confus��o entre pares de fones. Para cada um desses problemas bin��rios, s��o usadas t��cnicas de sele��o autom��tica de par��metros para escolher a representa��ao param��trica mais adequada para o problema em quest��o.

Veja mais

Avan��os em reconhecimento de fala para portugu��s brasileiro e aplica��es: ditado no libreoffice e unidade de resposta aud��vel com asterisk

Relevância:

100.00% 100.00%

Publicador:

Resumo:

O reconhecimento autom��tico de voz vem sendo cada vez mais ��til e poss��vel. Quando se trata de l��nguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situa��o n��o e a mesma para o Portugu��s Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que j�� existiram foram descontinuados. A presente disserta��o alinha-se com os objetivos do Laborat��rio de Processamento de Sinais da Universidade Federal do Par��, que �� o desenvolvimento de um reconhecedor autom��tico de voz para Portugu��s Brasileiro. Mais especificamente, as principais contribui��es dessa disserta��o s��o: o desenvolvimento de alguns recursos necess��rios para a constru��o de um reconhecedor, tais como: bases de ��udio transcrito e API para desenvolvimento de aplica��es; e o desenvolvimento de duas aplica��es: uma para ditado em sistema desktop e outra para atendimento autom��tico em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Portugu��s Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Portugu��s Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edi��o de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edi��o e formata��o de texto com comandos de voz. Outra contribui��o deste trabalho e a utiliza��o de reconhecimento autom��tico de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplica��o desenvolvida foi uma unidade de resposta aud��vel com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil liga��es di��rias.

Veja mais

Sistema baseado em software livre para reconhecimento de fala em nuvem em portugu��s brasileiro com alta disponibilidade

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Este trabalho visa propor uma solu��o contendo um sistema de reconhecimento de fala autom��tico em nuvem. Dessa forma, n��o h�� necessidade de um reconhecedor sendo executado na pr��pria m��quina cliente, pois o mesmo estar�� dispon��vel atrav��s da Internet. Al��m do reconhecimento autom��tico de voz em nuvem, outra vertente deste trabalho �� alta disponibilidade. A import��ncia desse t��pico se d��a porque o ambiente servidor onde se planeja executar o reconhecimento em nuvem n��o pode ficar indispon��vel ao usu��rio. Dos v��rios aspectos que requerem robustez, tal como a pr��pria conex��o de Internet, o escopo desse trabalho foi definido como os softwares livres que permitem a empresas aumentarem a disponibilidade de seus servi��os. Dentre os resultados alcan��ados e para as condi��es simuladas, mostrou-se que o reconhecedor de voz em nuvem desenvolvido pelo grupo atingiu um desempenho pr��ximo ao do Google.

Veja mais

Um software de reconhecimento de voz para portugu��s brasileiro

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Descreve a implementa��o de um software de reconhecimento de voz para o Portugu��s Brasileiro. Dentre os objetivos do trabalho tem-se a constru��o de um sistema de voz cont��nua para grandes vocabul��rios, apto a ser usado em aplica��es em tempo-real. S��o apresentados os principais conceitos e caracter��sticas de tais sistemas, al��m de todos os passos necess��rios para constru��o. Como parte desse trabalho foram produzidos e disponibilizados v��rios recursos: modelos ac��sticos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo constru��do atrav��s da extra��o e formata��o autom��tica de textos de jornais na Internet. Al��m disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho tamb��m prop��e a utiliza��o de t��cnicas de adapta��o de locutor para resolu��o de problemas de descasamento ac��stico entre corpora de voz. Por ��ltimo, �� apresentada uma interface de programa��o de aplicativos que busca facilitar a utiliza��o do decodificador Julius. Testes de desempenho s��o apresentados, comparando os sistemas desenvolvidos e um software comercial.

Veja mais

6 resultados para Automatic speech recognition (ASR)

em Universidade Federal do Pará

Filtro por publicador

Convers��o grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabul��rios para o portugu��s brasileiro

Classifica����o fon��tica utilizando Boosting e SVM

Ferramentas e recursos livres para reconhecimento e s��ntese de voz em portugu��s brasileiro

Avan��os em reconhecimento de fala para portugu��s brasileiro e aplica����es: ditado no libreoffice e unidade de resposta aud��vel com asterisk

Sistema baseado em software livre para reconhecimento de fala em nuvem em portugu��s brasileiro com alta disponibilidade

Um software de reconhecimento de voz para portugu��s brasileiro

Classifica��o fon��tica utilizando Boosting e SVM

Avan��os em reconhecimento de fala para portugu��s brasileiro e aplica��es: ditado no libreoffice e unidade de resposta aud��vel com asterisk