946 resultados para signal processing algorithms
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.
O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias.
As redes neurais artificiais têm provado serem uma poderosa técnica na resolução de uma grande variedade de problemas de otimização. Nesta dissertação é desenvolvida uma nova rede neural, tipo recorrente, sem realimentação (self-feedback loops) e sem neurônios ocultos, para o processamento do sinal sísmico, para fornecer a posição temporal, a polaridade e as amplitudes estimadas dos refletores sísmicos, representadas pelos seus coeficientes de reflexão. A principal característica dessa nova rede neural consiste no tipo de função de ativação utilizada, a qual permite três possíveis estados para o neurônio. Busca-se estimar a posição dos refletores sísmicos e reproduzir as verdadeiras polaridades desses refletores. A idéia básica desse novo tipo de rede, aqui denominada rede neural discreta (RND), é relacionar uma função objeto, que descreve o problema geofísico, com a função de Liapunov, que descreve a dinâmica da rede neural. Deste modo, a dinâmica da rede leva a uma minimização local da sua função de Liapunov e consequentemente leva a uma minimização da função objeto. Assim, com uma codificação conveniente do sinal de saída da rede tem-se uma solução do problema geofísico. A avaliação operacional da arquitetura desta rede neural artificial é realizada em dados sintéticos gerados através do modelo convolucional simples e da teoria do raio. A razão é para explicar o comportamento da rede com dados contaminados por ruído, e diante de pulsos fonte de fases mínima, máxima e misturada.
Este trabalho apresenta um método rápido de inversão de matrizes densas, e uma possível aplicação com métodos de Vectoring, em pré-codificação e cancelamento de crosstalk de sistemas xDSL. A família de tecnologias xDSL utiliza os pares trançados de fios de cobre telefônicos como meio físico para transmitir dados digitais. O crosstalk é a principal causa de degradação de sinais na mais nova geração de sistemas xDSL, o G.fast, e para combatê-lo são utilizadas técnicas de pré-codificação e cancelamento, chamadas de Vectoring. O método proposto, chamado de GSGR, consiste em uma abordagem diferente para o método clássico de Squared Givens Rotations (SGR), adequado a implementações em plataformas embarcadas de processamento digital de sinais. Foram realizados testes comparativos do método GSGR com métodos diretos clássicos de inversão, utilizando uma plataforma digital multicore baseada no chip TI DSP TMS320C6670 e a plataforma de software Matlab. Os resultados dos testes de inversão de matrizes usando dados reais e dados simulados mostraram que o GSGR foi superior em velocidade de execução sem apresentar perdas significativas de acurácia para a aplicação em sistemas xDSL.
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
This paper is concerned with what a source precisely sees when it drives a receiver such as a continuous structural object. An equivalent lumped element system consisting of masses, springs and dampers is developed to visually represent the operational structural dynamics of a single-input structure at the driving point. The development is solely based on the mobility model of the driving point response. The mobility model is mathematically inverted to give the impedance model that is suitable for lumped element modeling. The two types of structures studied are unconstrained inertial objects and constrained resilient objects. The lumped element systems presented suggest a new view to dynamics that a single-input flexible structure in operation can be decomposed into the two subsystems: a base system of single degree of freedom (or of a mass for an inertial object) whose mass is in contact with the source and an appendage system consisting of a series of oscillators each of which is attached to the base mass. The driving point response is a result of the coupling between the two subsystems. (C) 2014 Elsevier Ltd. All rights reserved.
In many movies of scientific fiction, machines were capable of speaking with humans. However mankind is still far away of getting those types of machines, like the famous character C3PO of Star Wars. During the last six decades the automatic speech recognition systems have been the target of many studies. Throughout these years many technics were developed to be used in applications of both software and hardware. There are many types of automatic speech recognition system, among which the one used in this work were the isolated word and independent of the speaker system, using Hidden Markov Models as the recognition system. The goals of this work is to project and synthesize the first two steps of the speech recognition system, the steps are: the speech signal acquisition and the pre-processing of the signal. Both steps were developed in a reprogrammable component named FPGA, using the VHDL hardware description language, owing to the high performance of this component and the flexibility of the language. In this work it is presented all the theory of digital signal processing, as Fast Fourier Transforms and digital filters and also all the theory of speech recognition using Hidden Markov Models and LPC processor. It is also presented all the results obtained for each one of the blocks synthesized e verified in hardware
Acceleration is a key parameter for engineering and is becoming increasingly important because of the need for companies to become more competitive in the market. Both applying new technologies to their products and optimizing their process lines with predictive maintenance and robotic automation. This study aims to analyze the quality of the signals obtained from a capacitive accelerometer. To do that a test rig was mounted, which consist of a shaker, fed by a signal generator, a linear potentiometer and a capacitive accelerometer; for the signal acquisition was used a acquisition board and the Labview software, in order to integrate twice the signal from the accelerometer and compare it with the sign of the potentiometer. This work also demonstrates the impact of acquired signal processing as well as techniques of pre and post processing of signal via software GNU/Octave
The main objective is to create a software, using C++ language, for reading and exhibiting in a graphic an Electrocardiogram (ECG) wave. The data is recorded as a FM modulated signal and compressed using Adaptive Differential Pulse Code Modulation (ADPCM). The signal have this characteristics because it was acquired using an experimental equipment, this equipment is the result of research made by the professor who supervised this work. FM demodulation techniques in discrete time, discrete filters and digital signal processing are some of the topics that can be found in this essay. Some concepts about the human heart and about ECG waves are also briefly introduced. These concepts are necessary for understanding the final evaluation of the software performance. The development is partly made using MATLAB. Most of the functions that are used on the software are first tested and designed in MATLAB environment. In the end, an evaluation is done comparing the results that are expected with the ones that MATLAB presents and the ones that the developed software presents
This work presents the development of a graphical interface to the Lock-in Amplifier, which is used in physiological studies on the motility of the gastrointestinal tract in rats and signal processing. With a simple and low cost instrumentation, the resources offered by the virtual interface of LabVIEW software allows the creation of commands similar to the actual instrument that, through communication via standard serial port, transmits data between a PC and peripheral device performing specific and particular needs in the amplifier. Created for the lock-in amplifier model SR830 Stanford Research Systems, the remote manipulation gives the user greater accessibility in the process of configuration and calibration. And, since the software is installed, there is the advantage of eliminating the need of purchase new devices to upgrade the system. The commands created were made to perform six basic modifications that are used in routine of the Biomagnetism Laboratory. The instrumentation developed has the following controls: Amplitude, Frequency, Time Constant, slope low pass filter, sensitivity and offset
In this letter, a speech recognition algorithm based on the least-squares method is presented. Particularly, the intention is to exemplify how such a traditional numerical technique can be applied to solve a signal processing problem that is usually treated by using more elaborated formulations.