951 resultados para Visual Speech Recognition, Multiple Views, Frontal View, Profile View
Resumo:
ARAUJO, Márcio V. ; ALSINA, Pablo J. ; MEDEIROS, Adelardo A. D. ; PEREIRA, Jonathan P.P. ; DOMINGOS, Elber C. ; ARAÚJO, Fábio M.U. ; SILVA, Jáder S. . Development of an Active Orthosis Prototype for Lower Limbs. In: INTERNATIONAL CONGRESS OF MECHANICAL ENGINEERING, 20., 2009, Gramado, RS. Proceedings… Gramado, RS: [s. n.], 2009
Resumo:
The automatic speech recognition by machine has been the target of researchers in the past five decades. In this period have been numerous advances, such as in the field of recognition of isolated words (commands), which has very high rates of recognition, currently. However, we are still far from developing a system that could have a performance similar to the human being (automatic continuous speech recognition). One of the great challenges of searches for continuous speech recognition is the large amount of pattern. The modern languages such as English, French, Spanish and Portuguese have approximately 500,000 words or patterns to be identified. The purpose of this study is to use smaller units than the word such as phonemes, syllables and difones units as the basis for the speech recognition, aiming to recognize any words without necessarily using them. The main goal is to reduce the restriction imposed by the excessive amount of patterns. In order to validate this proposal, the system was tested in the isolated word recognition in dependent-case. The phonemes characteristics of the Brazil s Portuguese language were used to developed the hierarchy decision system. These decisions are made through the use of neural networks SVM (Support Vector Machines). The main speech features used were obtained from the Wavelet Packet Transform. The descriptors MFCC (Mel-Frequency Cepstral Coefficient) are also used in this work. It was concluded that the method proposed in this work, showed good results in the steps of recognition of vowels, consonants (syllables) and words when compared with other existing methods in literature
Resumo:
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Resumo:
OBJETIVO: Avaliar quantitativamente as mudanças da posição palpebral e as medidas da fenda palpebral de indivíduos acima dos 50 anos. MÉTODOS: Estudo observacional, tendo sido avaliados 325 indivíduos, com idade acima de 50 anos, segundo distância intercantal, largura e altura da fenda palpebral, ângulo palpebral externo e interno, distância entre o reflexo pupilar e a margem da pálpebra superior (distância reflexo-margem) e a área total da fenda palpebral. Utilizou-se filmadora Sony Lithium para obtenção das imagens digitais, com o indivíduo fixando um objeto a 1 metro de distância, sendo as imagens transferidas posteriormente para computador McIntosh G4 e processadas pelo programa NIH 1.58. Os dados foram submetidos à análise estatística. RESULTADOS: Os participantes apresentavam dermatocálase (96,5%), ptose do supercílio (60,8%), prolapso de gordura orbital (50,0%) ou ptose palpebral (39,1%). As alterações foram bilaterais em 68,8% dos indivíduos. A distância intercantal aumentou com a idade; a largura da fenda palpebral, a distância reflexo-margem e a medida do ângulo externo diminuíram nos mais idosos. As diferenças foram mais significativas quando os olhos foram estudados separadamente. CONCLUSÃO: A distância intercantal aumenta, ao passo que a largura da fenda palpebral, a distância reflexo-margem e a área total da fenda palpebral diminuem com o aumento da idade.
Resumo:
O objetivo deste trabalho foi caracterizar biológica e molecularmente três isolados de Sugarcane mosaic virus (SCMV) de lavouras de milho, analisá-los filogeneticamente e discriminar polimorfismos do genoma. Plantas com sintomas de mosaico e nanismo foram coletadas em lavouras de milho, no Estado de São Paulo e no Município de Rio Verde, GO, e seus extratos foliares foram inoculados em plantas indicadoras e submetidos à análise sorológica com antissoros contra o SCMV, contra o Maize dwarf mosaic virus (MDMV) e contra o Johnsongrass mosaic virus (JGMV). Mudas de sorgo 'Rio' e 'TX 2786' apresentaram sintomas de mosaico após a inoculação dos três isolados, e o DAS-ELISA confirmou a infecção pelo SCMV. O RNA total foi extraído e usado para amplificação por transcriptase reversa seguida de reação em cadeia de polimerase (RT-PCR). Fragmentos específicos foram amplificados, submetidos à análise por polimorfismo de comprimento de fragmento de restrição (RFLP) e sequenciados. Foi possível discriminar os genótipos de SCMV isolados de milho de outros isolados brasileiros do vírus. Alinhamentos múltiplos e análises dos perfis filogenéticos corroboram esses dados e mostram diversidade nas sequências de nucleotídeos que codificam para a proteína capsidial, o que explica o agrupamento separado desses isolados e sugere sua classificação como estirpes distintas, em lugar de simples isolados geográficos.
Resumo:
OBJETIVO: comparar o desempenho de pacientes usuários e não usuários de AASI, por meio do teste SSW. MÉTODO: o estudo foi realizado em 13 sujeitos com idade entre 55 e 85 anos, com perda auditiva bilateral, sendo seis usuários de prótese auditiva bilateral e sete não usuários de prótese auditiva. O teste de processamento auditivo aplicado foi o teste de reconhecimento de dissílabos em tarefa dicótica SSW. Foi realizado um tratamento estatístico feito por meio da técnica Bootstrap e do Teste de Hipótese Kolmogorov-Smirnov. RESULTADOS: o grupo de usuários apresentou melhor desempenho nas condições estudadas do que o grupo de não usuários, principalmente nas condições competitivas. CONCLUSÃO: os resultados obtidos nessa pesquisa apontam para a eficácia do uso do AASI na melhora da compreensão de fala da população estudada, não somente pela compensação da perda auditiva periférica, mas também pela interferência no processo de envelhecimento do sistema nervoso auditivo central.
Resumo:
Purpose: To determine palpebral dimensions and development in Brazilian children using digital images. Methods: An observational study was performed measuring eyelid angles, palpebral fissure area and interpupillary distance in 220 children aged from 4 to 72 months. Digital images were obtained with a Sony Lithium movie camera (Sony DCR-TRV110, Brazil) in frontal view from awake children in primary ocular position; the object of observation was located at pupil height. The images were saved to tape, transferred to a Macintosh G4 (Apple Computer Inc., USA) computer and processed using NIH 1.58 software (NTIS, 5285 Port Royal Rd., Springfield, VA 22161, USA). Data were submitted to statistical analysis. Results: All parameters studied increased with age. The outer palpebral angle was greater than the inner, and palpebral fissure and angles showed greater changes between 4 and 5 months old and at around 24 to 36 months. Conclusion: There are significant variations in palpebral dimensions in children under 72 months old, especially around 24 to 36 months. Copyright © 2006 Informa Healthcare.
Resumo:
This letter describes a novel algorithm that is based on autoregressive decomposition and pole tracking used to recognize two patterns of speech data: normal voice and disphonic voice caused by nodules. The presented method relates the poles and the peaks of the signal spectrum which represent the periodic components of the voice. The results show that the perturbation contained in the signal is clearly depicted by pole's positions. Their variability is related to jitter and shimmer. The pole dispersion for pathological voices is about 20% higher than for normal voices, therefore, the proposed approach is a more trustworthy measure than the classical ones. © 2007.
Resumo:
Discriminative training of Gaussian Mixture Models (GMMs) for speech or speaker recognition purposes is usually based on the gradient descent method, in which the iteration step-size, ε, uses to be defined experimentally. In this letter, we derive an equation to adaptively determine ε, by showing that the second-order Newton-Raphson iterative method to find roots of equations is equivalent to the gradient descent algorithm. © 2010 IEEE.
Resumo:
Exploratory tasks supported by visualization are usually improved by Coordinated and Multiple Views (CMV) of the data under study. Several coordination techniques have been proposed in the literature, resulting in a diversity of tools to generate mappings among the multiple views. These mappings can be highly dynamic, and their history reveals the settings employed in the multiple exploratory tasks conducted in a discovery process. Several solutions have been proposed to help users to recover the steps performed in exploratory tasks, but little support is found for registering the multiple coordination mappings employed. This paper provides a contribution in this direction, proposing a model for storing and recovering such mappings. We believe such a facility is an important feature of CMV systems, so that users can recover and rerun the coordinations performed when exploring their data. We present details of the proposed model and show some potential applications. © 2012 IEEE.
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Pós-graduação em Artes - IA
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.