988 resultados para Análise acústica
Resumo:
Este trabalho apresenta um sistema de classificação de voz disfônica utilizando a Transformada Wavelet Packet (WPT) e o algoritmo Best Basis (BBA) como redutor de dimensionalidade e seis Redes Neurais Artificiais (ANN) atuando como um conjunto de sistemas denominados “especialistas”. O banco de vozes utilizado está separado em seis grupos de acordo com as similaridades patológicas (onde o 6o grupo é o dos pacientes com voz normal). O conjunto de seis ANN foi treinado, com cada rede especializando-se em um determinado grupo. A base de decomposição utilizada na WPT foi a Symlet 5 e a função custo utilizada na Best Basis Tree (BBT) gerada com o BBA, foi a entropia de Shannon. Cada ANN é alimentada pelos valores de entropia dos nós da BBT. O sistema apresentou uma taxa de sucesso de 87,5%, 95,31%, 87,5%, 100%, 96,87% e 89,06% para os grupos 1 ao 6 respectivamente, utilizando o método de Validação Cruzada Múltipla (MCV). O poder de generalização foi medido utilizando o método de MCV com a variação Leave-One-Out (LOO), obtendo erros em média de 38.52%, apontando a necessidade de aumentar o banco de vozes disponível.
Resumo:
The human voice is an important communication tool and any disorder of the voice can have profound implications for social and professional life of an individual. Techniques of digital signal processing have been used by acoustic analysis of vocal disorders caused by pathologies in the larynx, due to its simplicity and noninvasive nature. This work deals with the acoustic analysis of voice signals affected by pathologies in the larynx, specifically, edema, and nodules on the vocal folds. The purpose of this work is to develop a classification system of voices to help pre-diagnosis of pathologies in the larynx, as well as monitoring pharmacological treatments and after surgery. Linear Prediction Coefficients (LPC), Mel Frequency cepstral coefficients (MFCC) and the coefficients obtained through the Wavelet Packet Transform (WPT) are applied to extract relevant characteristics of the voice signal. For the classification task is used the Support Vector Machine (SVM), which aims to build optimal hyperplanes that maximize the margin of separation between the classes involved. The hyperplane generated is determined by the support vectors, which are subsets of points in these classes. According to the database used in this work, the results showed a good performance, with a hit rate of 98.46% for classification of normal and pathological voices in general, and 98.75% in the classification of diseases together: edema and nodules
Resumo:
TEMA: análise acústica da fala. OBJETIVO: analisar acusticamente as substituições envolvendo o contraste entre /t/ e /k/ na fala de crianças em aquisição típica e desviante do contraste acima referido, a fim de identificar e quantificar a existência de contrastes encobertos. MÉTODO: foi elaborado um experimento de produção de fala que envolveu a repetição de palavras, que combinavam /t/ e /k/ com /a/ e /u/ na posição acentuada, por 9 crianças divididas em três grupos: crianças em processo de aquisição do contraste investigado (G1); crianças com transtorno fonológico (G2) e crianças com produções típicas (G3). Com o uso do software Praat, as produções foram editadas e analisadas de acordo com os seguintes parâmetros acústicos: características espectrais do burst; transição CV e características temporais. Os testes estatísticos utilizados foram ANOVA de Friedman e Manova. A significância estatística adotada foi menor que 0,05. RESULTADOS: tanto nas produções das crianças do G2 quanto nas produções das crianças do G1, detectamos, em grande medida (80% e 57,4%, respectivamente), a presença de contrastes encobertos nos erros de substituição das oclusivas investigadas. Adicionalmente, a análise acústica revelou diferenças em como as crianças utilizam as pistas fonético-acústicas para marcarem a distinção entre /t/ e /k/. CONCLUSÃO: muitas das substituições presentes da produção de fala de crianças em processo de aquisição típico e desviante tratam-se na verdade de contrastes fônicos encobertos. Além disso, o uso da análise acústica permitiu a detecção de diferenças sutis da produção da fala das crianças.
Resumo:
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Resumo:
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Resumo:
Police officers are exposed to impact noise coming from firearms, which may cause irreversible injuries to the hearing system.Aim: To evaluate the noise exposure in shooting stands during gunfire exercises, to analyze the acoustic impact of the noise produced by the firearms and to associate it with tonal audiometry results.Study design: Cross-sectional.Materials and methods: To measure noise intensity we used a digital sound level meter, and the acoustic analysis was carried out by means of the oscillations and cochlear response curves provided by the Praat software. 30 police officers were selected (27 males and 3 females).Results: The peak level measured was 113.1 dB(C) from a .40 pistol and 116.8 dB(C) for a .38 revolver. The values obtained for oscillation and Praat was 17.9 +/- 0.3 Barks, corresponding to the rate of 4,120 and 4,580 Hz. Audiometry indicated greater hearing loss at 4,000Hz in 86.7% of the cases.Conclusion: With the acoustic analysis it was possible to show cause and effect between the main areas of energy excitation of the cochlea (Praat cochlear response curve) and the frequencies of low hearing acuity.
Resumo:
OBJETIVO: traduzir e adaptar protocolo desenvolvido por pesquisadores alemães, adequando-o às características fonéticas e linguísticas do português falado no Brasil. Caracterizar os componentes de fala mais alterados na população com doença de Parkinson, comparando-os com grupo de sujeitos normais na mesma faixa etária. MÉTODOS: realizou-se a tradução e adaptação do protocolo. Posteriormente foram avaliados 21 pacientes com diagnóstico neurológico de Doença de Parkinson nos estágios Hoehn &Yarh, entre 2 e 3, e 10 sujeitos normais. O protocolo incluía avaliação da respiração, fonação, ressonância, articulação, prosódia e a análise acústica dos parâmetros vocais. RESULTADOS: o protocolo mostrou-se de fácil aplicação clínica. Nos sujeitos com doença de Parkinson foram observadas alterações predominantes na fonação (85,9%) e articulação (42,9%). CONCLUSÃO: o estudo demonstrou ser o protocolo uma ferramenta eficiente para a avaliação da disartria em pacientes com doença de Parkinson.
Resumo:
OBJETIVO: estudar o valor da freqüência fundamental e suas variações presentes no choro de dor de recém-nascidos. MÉTODOS: foram gravadas as emissões de 111 recém-nascidos de termo e saudáveis, com idade de 24 a 72 horas durante procedimento da punção venosa periférica. A análise acústica foi realizada por meio dos softwares VOXMETRIA 1.1 com extração do valor da freqüência fundamental e GRAM 5.7 para verificar a ocorrência de variações da freqüência fundamental como quebras, bitonalidade e freqüência hiperaguda. A escala de dor NIPS foi realizada no momento da punção. A análise estatística é descritiva com extração dos valores de média, desvio-padrão e freqüência de ocorrência dos eventos. RESULTADOS: os recém-nascidos apresentaram 100% de suas emissões com variações de freqüência, ou seja, quebras e bitonalidade. A freqüência hiperaguda foi encontrada em 34,2% dos recém-nascidos. CONCLUSÃO: por meio do choro, o recém-nascido comunica sua dor. A emissão de dor do recém-nascido é tensa e estridente, com freqüência fundamental aguda e variações encontradas no traçado espectrográfico, como quebras, bitonalidade e freqüência hiperaguda. Tais características são importantes para chamar a atenção do adulto no pronto atendimento ao recém-nascido e auxiliar na avaliação de dor durante um procedimento.
Resumo:
Pós-graduação em Educação - FFC
Resumo:
A voz e a habilidade vocal são diferentes em cada indivíduo e em cada fase da vida. Devido aos escassos estudos sobre a qualidade vocal de meninos e adolescentes durante a puberdade, o presente estudo teve como objetivo quantificar os seguintes parâmetros da análise acústica da voz: frequência fundamental, jitter, shimmer, relação harmônico-ruído e intensidade. Para entender como se dá a variação da voz com o desenvolvimento de meninos e adolescentes, esses parâmetros foram correlacionados entre si e também com o grau do desenvolvimento puberal de sujeitos do sexo masculino. Métodos: Foram sujeitos desse estudo 110 indivíduos do sexo masculino, com idade entre 11 e 20 anos, estudantes de três escolas estaduais de Macapá, onde foi feita a coleta dos dados. Os sujeitos foram divididos em 4 grupos, 32 sujeitos com idade entre 11 e 12 anos compuseram o Grupo I, 29 sujeitos com idade entre 13 e 15 anos o Grupo II, o Grupo III foi composto por 30 sujeitos com idade entre 16 e 18 anos, e o Grupo IV por sujeitos com idade entre 19 e 20 anos. Todos os sujeitos foram submetidos à gravação da voz diretamente no computador com auxilio de microfone unidirecional. Solicitou-se emissão sustentada da vogal /é/ e fala encadeada: contagem de 1 a 10 e leitura de um parágrafo pré-estabelecido. Em seguida os sujeitos foram avaliados por um médico clínico geral para caracterização do desenvolvimento puberal de acordo com os estágios descritos por Tanner. A análise vocal foi realizada com o programa acústico Voz Metria®. Resultados: Os sujeitos apresentaram F0 média durante a vogal sustentada de 223,28 Hz, 249,86 Hz, 122,63 Hz e 127,61 Hz para os Grupos I, II, III e IV respectivamente. A F0 durante a fala encadeada foi de 217,09 Hz, 246,18 Hz, 117,27 Hz e 123,42 para os Grupos I, II, III e IV respectivamente. Shimmer apresentou valores aumentados nos quatro grupos. Jitter, intensidade e a relação harmônico-ruído mantiveram-se dentro dos padrões de normalidade estabelecidos pelo programa acústico utilizado. Quanto ao desenvolvimento puberal, a maioria dos sujeitos está em G3 (n=38; 34,5%) e G4 (n=42; 38,2%) e P3 (n=34; 31%) e P4 (n=36; 32,7%). O grau de desenvolvimento puberal está correlacionado com aF0 durante a fala encadeada (p<0,001) e com a F0 durante a emissão da vogal sustentada (p<0,001) e essa correlação foi estatisticamente significante entre G2 e G5, e G3 e G5. Conclusão: Até os 15 anos os parâmetros vocais acústicos são típicos da voz infantil. Dos 16 aos 20 anos há decréscimo significativo da F0, porém a voz ainda está em processo de estabilização, com valores aumentados de shimmer. F0 é o único parâmetro correlacionado com o grau de desenvolvimento puberal. A finalização do processo de muda vocal se apresentou, na população estudada, como um evento tardio em relação ao desenvolvimento puberal.
Resumo:
A presente pesquisa tem como tema o estudo perceptual da prosódia como elemento de segmentação de narrativas orais espontâneas e visa confirmar, ou não, se a prosódia facilita ao ouvinte leigo e inexperiente perceber a estrutura do texto narrativo. Este estudo investiga se a diferença de tom é um elemento prosódico relevante. A dissertação tem como corpus quatro narrativas espontâneas, as quais fazem parte do corpus analisado por Oliveira Jr.(2000), autor do projeto que inspirou esta pesquisa. Para saber se os participantes são capazes de delimitar a estrutura narrativa, baseando-se apenas no aspecto perceptual, conduziu-se um teste de percepção com 112 voluntários, recrutados na Universidade Federal do Pará e na Universidade Federal de Alagoas. Coube aos participantes a tarefa de indicar os pontos em que o falante teve a intenção de finalizar uma unidade comunicativa nas narrativas. A interpretação sobre unidade comunicativa foi subjetiva. Apresentou-se cada narrativa em quatro condições diferentes, a saber: (i) transcrição sem marca de pontuação e sem paragrafação; (ii) transcrição da narrativa acompanhada de áudio ; (iii) narrativa somente em áudio e (iv) áudio filtrado da narrativa, resultando numa versão deslexicalizada (fala ininteligível), mas com preservação da estrutura prosódica do discurso. Nas duas primeiras condições, a segmentação foi no texto transcrito, com barras transversais (/); nas demais, utilizou-se um programa de computador chamado ELAN. A análise dos dados obtidos baseou-se em tabelas, gráficos, análise estatística (teste do Qui-Quadrado), análise acústica (utilização do Programa PRAAT). Os resultados sinalizam que a prosódia ajuda o ouvinte leigo a perceber a estrutura básica do discurso narrativo. Com relação ao peso do Pitch Reset para auxiliar os ouvintes na demarcação de fronteiras, pode-se dizer que o teste estatístico do Qui-Quadrado encontrou evidências que lhe atribui essa função. Assim, neste contexto, ratifica-se o relevante papel da prosódia para o reconhecimento da estrutura de narrativas orais espontâneas e identifica-se o reflexo do peso da diferença de tom na percepção dos participantes.
Resumo:
Este artigo trata essencialmente de uma apresentação das ações do projeto institucional Norte Vogais vinculado ao Diretório Nacional PROBRAVO. O artigo fornece uma ideia precisa de como a equipe da UFPA vinculada ao PROBRAVO está conduzindo suas investigações sobre a variedade do português falada no Pará. O projeto Norte Vogais conta com amostras de fala de trezentos e dezoito informantes nativos do Pará no seu banco de dados. As descrições sociolinguísticas empreendidas pela equipe da UFPA priorizaram a investigação de três aspectos fonéticos em particular: a) a variação das vogais médias pretônicas; b) a variação das vogais médias postônicas mediais e; c) a nasalidade alofônica. Os resultados obtidos reforçam a hipótese de Silva Neto (1957) de que o Pará compreenderia uma ilha dialetal na classificação de Antenor Nascente entre os dialetos do Norte do Brasil. Com o objetivo de refinar as descrições sociolingüísticas, duas novas ações se impuseram: a) o mapeamento da situação sociolinguística das áreas de contato interdialetal no Pará e; b) a análise acústica do sistema vocálico do português falado na Amazônia Paraense.
Resumo:
There is in the literature a divergent description between lexical knowledge and word production accuracy. The aims of this study were: (a) to investigate the influence (effect) of the word lexical knowledge over production accuracy; (b) in case there is, to characterize acoustically this interference. Eight children (5-6 years old) with typical development language participated of this study. The methodological procedure consisted of: (a) survey of the children lexical knowledge concerning to IAFAC’s words; (b) recordings of the IAFAC’s words; (c) identifi cation and characterization of the linguistic cues, by acoustic analysis, in the IAFAC’s word production in function of the different knowledge degrees. Our results suggest a negative correlation (r=-0,13, p=0,000) between lexical knowledge and presence of the linguistics cues in word’s production. However, the linguistics cues refer to hesitative cues instead of phonological errors. Implications of these results for clinical practicing are discussed.
Resumo:
The aim of this study is to compare acoustic measures (frequency, duration and intensity) of the vowels /i, a, u/ in repetition and spontaneous tasks. Recordings of words produced by ten children with typical language development in both controlled and spontaneous tasks were selected from a database. The vowels were selected and edited into individual files in the software PRAAT. Acoustic measures related to formant frequency (F1 and F2), intensity and duration of vowels in both contexts were extracted. The values obtained were compared by means of T Tests. In general, the acoustic analysis showed no differences between the two contexts of speech production. The few differences found can be explained by the presence of focus and/or hesitation phenomena during the speech productions. It is possible to use data from spontaneous context to analyze the vowels acoustically, provided that both the phonetic context of the vowel occurrence and the syllable stress of the vocalic segment are considered.
Resumo:
A disfonia espasmódica é um distúrbio vocal grave, caracterizada por espasmos musculares laríngeos durante a fonação, produzindo voz tensa e estrangulada. Atualmente, acredita-se que tenha origem neurológica, mas há evidências que associam suas causas com alterações psicogênicas. O presente estudo visa descrever dois casos diagnosticados como disfonia espasmódica, com manifestações fonoaudiológicas e psicológicas distintas. O estudo descritivo foi realizado por meio de análise dos prontuários, incluindo avaliação otorrinolaringológica, neurológica, avaliação vocal perceptivo-auditiva, análise acústica e Protocolo de Qualidade de Vida e Voz (QVV). Caso 1: sexo feminino, 65 anos, discreta coaptação de bandas ventriculares, fenda fusiforme e intenso tremor laríngeo. Apresentou quadro de alucinação, diagnosticada, posteriormente, como Esquizofrenia. Faz uso de Risperidona e Pondera. Apresentou loudness rebaixado, pitch agravado, rouquidão, hipernasalidade leve, tempo máximo de fonação reduzido, incoordenação pneumofonoarticulátoria e G², R², Bº, Aº, S³. Caso 2: sexo feminino, 68 anos, alteração das pregas vocais e intenso estrangulamento de bandas ventriculares. Sofreu três acidentes vasculares encefálicos (AVE) e, após o primeiro, iniciou-se a rouquidão. Realiza atendimento psicológico, ainda sem diagnóstico fechado. Apresentou loudness rebaixado, pitch agudizado, diplofonia durante a conversação, tempo máximo de fonação reduzido, incoordenação pneumofonoarticulatória e G³, R², Bº, Aº, S³. Os dados demonstraram distintos graus de severidades nas manifestações otorrinolaringológicas e fonoaudiológicas, além de diferentes envolvimentos psicogênicos. O grau de severidade ficou implícito no impacto da voz na qualidade de vida das pacientes estudadas.