16 resultados para Speech Recognition System using LPC
em Universidade Federal do Pará
Resumo:
Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.
Resumo:
Este trabalho visa propor uma solução contendo um sistema de reconhecimento de fala automático em nuvem. Dessa forma, não há necessidade de um reconhecedor sendo executado na própria máquina cliente, pois o mesmo estará disponível através da Internet. Além do reconhecimento automático de voz em nuvem, outra vertente deste trabalho é alta disponibilidade. A importância desse tópico se d´a porque o ambiente servidor onde se planeja executar o reconhecimento em nuvem não pode ficar indisponível ao usuário. Dos vários aspectos que requerem robustez, tal como a própria conexão de Internet, o escopo desse trabalho foi definido como os softwares livres que permitem a empresas aumentarem a disponibilidade de seus serviços. Dentre os resultados alcançados e para as condições simuladas, mostrou-se que o reconhecedor de voz em nuvem desenvolvido pelo grupo atingiu um desempenho próximo ao do Google.
Resumo:
O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.
Resumo:
Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.
Resumo:
Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros.
Resumo:
O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias.
Resumo:
A universalização do fornecimento de energia elétrica é uma meta ainda distante de ser alcançada na Amazônia brasileira, em face dos obstáculos geográficos, da dispersão de seus habitantes, da indefinição de tecnologias adequadas, além dos aspectos econômicos, em que pese ações governamentais, traduzidas no Programa Luz para Todos - PLpT, criado em 2003, cuja meta é atender a totalidade dos consumidores rurais até 2010, e a determinação da Agência Nacional de Energia Elétrica –ANEEL, responsável no Brasil pela regulação do setor elétrico, da obrigatoriedade da universalização até 2015. Este trabalho descreve pesquisa realizada no rio Madeira, na Amazônia brasileira, em que a geração de energia elétrica para atendimento de comunidades e pequenas cidades ao longo do rio, contribuindo para a universalização, pode ser viabilizada usando como fonte renovável inédita a biomassa lenhosa depositada no fundo do rio, decorrente de processos naturais, cuja retirada faz parte da rotina do Ministério dos Transportes, por obrigação legal, para viabilizar segurança na navegação. Como etapa inicial foram realizadas revisões bibliográficas para dar suporte à fundamentação teórica acerca de sistema elétrico brasileiro, universalização de acesso à energia elétrica, fontes renováveis na Amazônia, tecnologias para geração de eletricidade usando biomassa como fonte, subsídios no setor elétrico do Brasil, o rio Madeira, suas características e importância, além de ferramentas de análise de investimento. Em seguida, foram coletadas informações junto à AHIMOC, órgão responsável pela hidrovia do Madeira, quanto aos dados quantitativos e qualitativos da retirada de biomassa lenhosa do leito desse rio, bem como trabalhos de coleta in locu de amostras dessa biomassa para posterior análise de suas características físico-químicas em laboratório da UFAM. De posse dessas informações procedeu-se a avaliação de potencial de geração de energia elétrica da biomassa, assim como de rotas tecnológicas para tal. Os resultados obtidos das biomassas coletadas serviram como balizadores para confirmação de valores constantes na literatura e foram usados posteriormente na avaliação de potencial de geração de energia elétrica com identificação de rotas tecnológicas para tal. Etapa posterior contemplou a obtenção junto à concessionária de identificação e caracterização de potenciais mercados consumidores localizados na calha do Rio Madeira. Uma vez caracterizada a biomassa disponível, as possíveis rotas tecnológicas e os potenciais mercados consumidores, foram avaliados os aspectos tecnológicos, econômicos, ambientais, sociais e legais envolvidos. O estudo conclui pela competitividade do sistema de gaseificação, podendo contribuir para a universalização do acesso a eletricidade, cuja viabilização depende de adoção de política pública neste sentido, a partir de ações entre os Ministérios dos Transportes, de Minas e Energia e do Meio Ambiente. Conclui, também, pelo potencial de atração de capital privado, o que contribuiria para a redução de gastos públicos. Trabalhos futuros quanto à replicabilidade do estudo em áreas com fenômeno semelhante, bem como de oportunidades de uso de outras biomassas apresentam-se viáveis.
Resumo:
Este trabalho ressalta a importância de monitorar e diagnosticar a qualidade de energia elétrica sob a ótica das distorções harmônicas presente nas instalações elétricas em sistema trifásico de baixa tensão através de uma proposta metodológica para analisar e diagnosticar o nível dos distúrbios harmônico avaliando o indicador total de distorção harmônica (THD), apoiado por um sistema especialista baseado em um sistema de inferência Fuzzy.
Resumo:
O trabalho em questão apresenta uma proposta do suprimento de energia elétrica de um alimentador de distribuição pela operação isolada de uma usina geradora de energia elétrica que utiliza como fonte primária a energia calorífica da incineração de resíduos sólidos urbanos. O suprimento proposto é sugerido após a constatação do esgotamento da capacidade da subestação supridora desse alimentador. O esgotamento é verificado a partir de simulações realizadas no sistema de distribuição real da Rede Celpa, localizado na região Nordeste do Estado do Pará, o qual atende os municípios Santa Izabel do Pará, Santo Antonio do Tauá, Colares, Vigia e São Caetano de Odivelas. Nas simulações é utilizado um programa de fluxo de carga desenvolvido especificamente para os sistemas radias de distribuição e da subtransmissão. A proposta de suprimento via geração de energia elétrica através da incineração dos resíduos sólidos urbanos se dá a partir do confronto entre as alternativas de expansão (a alternativa técnica normalmente praticada pela concessionária) e a alternativa técnica-econômica-ambiental sugerida neste trabalho que demonstra as vantagens econômicas, sociais e ambientais da proposta.
Resumo:
O conhecimento prévio do valor da carga é de extrema importância para o planejamento e operação dos sistemas de energia elétrica. Este trabalho apresenta os resultados de um estudo investigativo da aplicação de Redes Neurais Artificiais do tipo Perceptron Multicamadas com treinamento baseado na Teoria da Informação para o problema de Previsão de Carga a curto prazo. A aprendizagem baseada na Teoria da Informação se concentra na utilização da quantidade de informação (Entropia) para treinamento de uma rede neural artificial. Dois modelos previsores são apresentados sendo que os mesmos foram desenvolvidos a partir de dados reais fornecidos por uma concessionária de energia. Para comparação e verificação da eficiência dos modelos propostos um terceiro modelo foi também desenvolvido utilizando uma rede neural com treinamento baseado no critério clássico do erro médio quadrático. Os resultados alcançados mostraram a eficiência dos sistemas propostos, que obtiveram melhores resultados de previsão quando comparados ao sistema de previsão baseado na rede treinada pelo critério do MSE e aos sistemas previsores já apresentados na literatura.
Resumo:
O estado do Maranhão possui um grande potencial pesqueiro; entretanto, a pesca foi excluída das prioridades governamentais e científicas. Considerando as lacunas de conhecimento existentes, este trabalho realizou um diagnóstico dos dados pretéritos e atuais disponíveis sobre a pesca no Estado, abordando o estado da arte, caracterização das embarcações e artes de pesca, além da análise de produção, espécies de valor comercial e socioeconomia dos atores sociais envolvidos. A partir do quadro visualizado foi possível delimitar a existência de 21 unidades, aqui denominadas de Sistema de Produção Pesqueira, por meio de um processo de subdivisões sucessivas da atividade pesqueira de acordo com a frota, prática ou arte de pesca, recursos explorados, ambiente, residência, relação de trabalho e renda do pescador e grau de isolamento da área de pesca. Para tanto, foram aplicados questionários com os diferentes atores sociais e vivência em campo. Os sistemas foram caracterizados segundo os aspectos econômicos, sociais, tecnológicos, ecológico e manejo, evidenciando-se uma ampla variedade de práticas e frotas, que atuam, predominantemente, em ambientes costeiros, com pequenas embarcações e artes de pescas simples, capturando diferentes espécies-alvo, principalmente das famílias Scianidae e Aridae. O quadro socioeconômico dos pescadores é de pobreza e abandono, com baixa organização social e pequena renda, precárias condições de moradia e nível educacional e acesso à saúde limitado. O mercado e a legislação têm propiciado o livre acesso aos recursos e práticas predatórias, comprometendo os recursos pesqueiros, que são explotados sem qualquer preocupação com a sustentabilidade, demonstrando insuficiências nas ações de manejo e gerenciamento. Na tentativa de detectar indicadores que estimem o estado de “saúde” dos sistemas utilizou-se a metodologia do Rapfish, através de um conjunto de atributos agrupados em cinco áreas temáticas: ecológica, econômica, social, tecnológica e manejo. Os resultados destacaram como bons indicadores: organização social, número de pescadores explorando o sistema; grau de escolaridade; uso de petrechos destrutivos; medidas de manejo governamentais e tradicionais. A relação de trabalho e renda foram bons critérios para diferenciar três tendências na finalidade das pescarias: subsistência, intermediárias e “semi-indutrial”. Alguns sistemas se destacaram como menos sustentável a exemplo das capturas de siris, que tem declinado por falta de manejo, deficiente organização social e a comercialização de fêmeas ovadas; e das pescarias de lagosta, que utilizam artes consideradas destrutivas. O sistema que envolve a captura de caranguejo sobressaiu-se pela existência de medidas de manejo tradicional e melhor gerenciamento do recurso pelos órgãos públicos. Assim, este estudo permitiu o uso de um sistema de referência para análise e monitoramento da sustentabilidade das pescarias regionais, com em indicadores científicos e/ou etnoconhecimento, que induziu ao surgimento de propostas de manejo norteadas pelo gerenciamento da pesca, organização social e educação ambiental. A seguir, foi realizado estudo de caso do sistema de produção que utilizam as embarcações de médio porte nas pescarias de Cynoscion acoupa utilizando como arte o malhão, para entrar em detalhes de um dos sistemas de produção. Essa escolha teve como base, os grandes volumes de captura, a grande abrangência da área de atuação desse sistema em todo o litoral do Estado, além do grande número de pescadores envolvidos nele, representando importante fonte de renda para o Estado. O estudo de caso prestou especial atenção aos saberes tradicionais da população no uso e na manutenção do recurso, complementados com estudos sobre a pesca e biologia reprodutiva de Cynoscion acoupa, capturadas na região da baía de São Marcos e adjacências. As capturas das pescadas-amarela ocorreram durante todo o ano com safra no início do período chuvoso, e produção estadual estimada em 10.600.00 kg/ano. Verificou-se que este sistema vem sofrendo intensa e desordenada exploração, sendo possível inferir pelas características biológicas da espécie, que o crescente nível de esforço não é compatível com a capacidade de suporte ambiental nem como as necessidades dos pescadores. Quanto aos parâmetros reprodutivos, verificou-se que o comprimento médio de primeira maturação sexual (L50) para os machos foi de 39,9 cm e para as fêmeas a primeira maturação sexual ocorreu com tamanho ligeiramente superior, 41,6 cm de comprimento total. A proporção sexual foi de 1:1,4 favorável aos machos. Constatou-se que a espécie em questão completa todo o seu ciclo de vida na área estudada; o processo reprodutivo ocorre durante todo o ano, com dois picos de desova, um no bimestre novembro/dezembro e outro em março/maio. Acredita-se que por meio das informações obtidas é possível subsidiar melhores propostas e ações de sustentabilidade desta pescaria, combinando o etno-conhecimento e o conhecimento científico deste sistema.
Resumo:
A presente dissertação avalia a margem de estabilidade de tensão da subestação de Rurópolis-PA 230 kV do sistema elétrico Tramoeste da Eletrobrás Eletronorte, utilizando medições locais de fasores de tensão e corrente obtidos através do concentrador de dados fasoriais ou (PDC, do inglês Phasor Data Concentrator) da Eletronorte. A avaliação é baseada na identificação dos parâmetros do equivalente Thevenin (tensão e impedância) “vistos” a montante da subestação em estudo. Os parâmetros do equivalente Thévenin são estimados a partir dos fasores de tensão e corrente medidos localmente, assim como a impedância da carga é calculada usando os mesmos fasores. A margem de estabilidade de tensão determina a distância dada entre os valores, em módulo, da impedância de Thévenin e da impedância da carga. Essa margem, para a subestação referida, foi avaliada em três casos. O primeiro caso avalia a margem considerando dois patamares de carga (leve e pesada); o segundo caso avalia a margem considerando dois níveis de geração na Usina de Tucuruí; e o terceiro caso avalia a margem frente a duas perturbações no Sistema Interligado Nacional (SIN), sendo uma perturbação mais próxima, eletricamente, e outra mais distante da subestação de Rurópolis 230 kV. Os resultados obtidos demonstram uma aplicação promissora das análises propostas para serem usadas em tempo real em sistemas de potência, beneficiando aplicações de ações corretivas.
Comparison of two computerized procedures for the assessment of color discrimination in Cebus apella
Resumo:
Color vision consists of the discrimination of objects based on their spectral composition. Among primates, the majority of Platyrrhini monkeys are estimated to have polymorphic and sex-linked dichromacy. The objective of this study was to compare the results produced by different equipment and software for the assessment of tri- and dichromatic conditions in one male and two female Cebus apella. Three experiments were programmed. In Experiment 1, verifying the trichromatic condition of one female subject and dichromatic condition of the remainder of the subjects was possible using an adapted version of the Cambridge Colour Test. Experiment 2 confirmed the results of Experiment 1 using a different array of stimuli of the same test. Experiment 3, which produced results similar to Experiment 2, consisted of a test developed for a standard computer system using stimuli with color properties similar to the ones used in the previous experiment. Favorable conditions for the assessment of color vision in Platyrrhini can be built with low-cost equipment and software. Once data have been gathered with additional subjects and new stimulus arrangements have been tested and confirmed, the procedure can be used for the evaluation of other Platyrrhini species for which behavioral color discrimination data are currently lacking.
Resumo:
Na Amazônia o cromo é empregado principalmente na indústria de couro e de madeira, sendo responsável por vários problemas de saúde porque é tóxico para os seres vivos. A remoção de cromo de efluentes industriais é feita por meio de diversos processos como a adsorção. Este trabalho mostra os resultados da adsorção de Cr(VI) por carvão ativado granular comercial (CAG) como adsorvente de soluções diluídas empregando um sistema de adsorção batelada com controle de pH. Os grupos funcionais da superfície do CAG foram determinados pelo método de Boehm. Além disso, o efeito do pH na adsorção de Cr(VI), o equilíbrio e a cinética de adsorção foram estudados nas condições experimentais (pH = 6, MA = 6g, tempo de adsorção 90min.). Na superfície do CAG, os grupos carboxílicos foram determinados em maior concentração (MAS=0,43 mmol/gCAG), estes, presentes em concentrações elevadas aumentam a adsorção do metal, principalmente em valores de pH ácidos. A capacidade de adsorção é dependente do pH da solução, devido a sua influência nas propriedades de superfície do CAG e nas diferentes formas iônicas das soluções de Cr(VI). Os dados de equilíbrio da adsorção foram ajustados satisfatoriamente pela isoterma de Langmuir (R2=0,988), tipo favorável. A partir da cinética de adsorção a 5mg/L e 20mg/L, os resultados obtidos foram compatíveis com o valor limite preconizado na legislação nacional (Res. nº 357/05). Portanto, para o sistema experimental utilizando CAG foi eficiente na remoção de Cr(VI) a partir de correntes líquidas contendo baixas concentrações do metal.
Resumo:
Pelo uso de técnicas mais baratas, como a do SDDC, é possível determinar níveis traços de arsênio em cabelo; entretanto esta técnica apresenta alguns inconvenientes como baixa estabilidade e o odor desagradável da piridina. A piridina foi substituída por trietanolamina/CHCl3 e as características analíticas do complexo foram estudadas. O complexo foi estável por 270 minutos, a faixa de aplicação da lei de Beer foi de 0,0 a 25,0 mg As, a repetibilidade foi de 0,028 mg As, o limite de detecção foi de 18,6 mg de As/L e a sensibilidade (e)? de 1,12 104 L.mol-1.cm-1. O método foi aplicado à amostras de cabelo. A lavagem das amostras foi feita com extran e água desionizada e seca em estufa (40-60ºC). 0,1000 g de amostra foi submetida à 11 métodos de digestão. O melhor método foi o que usou uma solução 1:1 de HNO3 e H2SO4 concentrados em temperatura de 100-110ºC com evaporação até fumos de SO3. O tempo de abertura é um inconveniente neste tipo de digestão.