993 resultados para emotional speech
Resumo:
Feature-based vocoders, e.g., STRAIGHT, offer a way to manipulate the perceived characteristics of the speech signal in speech transformation and synthesis. For the harmonic model, which provide excellent perceived quality, features for the amplitude parameters already exist (e.g., Line Spectral Frequencies (LSF), Mel-Frequency Cepstral Coefficients (MFCC)). However, because of the wrapping of the phase parameters, phase features are more difficult to design. To randomize the phase of the harmonic model during synthesis, a voicing feature is commonly used, which distinguishes voiced and unvoiced segments. However, voice production allows smooth transitions between voiced/unvoiced states which makes voicing segmentation sometimes tricky to estimate. In this article, two-phase features are suggested to represent the phase of the harmonic model in a uniform way, without voicing decision. The synthesis quality of the resulting vocoder has been evaluated, using subjective listening tests, in the context of resynthesis, pitch scaling, and Hidden Markov Model (HMM)-based synthesis. The experiments show that the suggested signal model is comparable to STRAIGHT or even better in some scenarios. They also reveal some limitations of the harmonic framework itself in the case of high fundamental frequencies.
Resumo:
Study of emotions in human-computer interaction is a growing research area. This paper shows an attempt to select the most significant features for emotion recognition in spoken Basque and Spanish Languages using different methods for feature selection. RekEmozio database was used as the experimental data set. Several Machine Learning paradigms were used for the emotion classification task. Experiments were executed in three phases, using different sets of features as classification variables in each phase. Moreover, feature subset selection was applied at each phase in order to seek for the most relevant feature subset. The three phases approach was selected to check the validity of the proposed approach. Achieved results show that an instance-based learning algorithm using feature subset selection techniques based on evolutionary algorithms is the best Machine Learning paradigm in automatic emotion recognition, with all different feature sets, obtaining a mean of 80,05% emotion recognition rate in Basque and a 74,82% in Spanish. In order to check the goodness of the proposed process, a greedy searching approach (FSS-Forward) has been applied and a comparison between them is provided. Based on achieved results, a set of most relevant non-speaker dependent features is proposed for both languages and new perspectives are suggested.
Resumo:
348 p.
Resumo:
244 p.
Resumo:
A linguagem e a comunicação são certamente as aquisições mais notáveis e significativas no processo de evolução humana. A fala é apenas um das formas da linguagem, embora seja a mais empregada pelo ser humano. Cerca de uma em cada duzentas pessoas é incapaz de comunicar-se através da fala devido a problemas neurológicos, físicos, emocionais e cognitivos, como é o caso das pessoas com paralisia cerebral, autismo, deficiência intelectual e alterações cognitivas. Nestes casos, pode ser necessário o uso da comunicação alternativa. A Comunicação Alternativa é definida como qualquer forma de comunicação diferente da fala, como o uso gestos manuais, expressões faciais e corporais, símbolos gráficos, linguagem alfabética, voz digitalizada ou sintetizada dentre outros, e é utilizada em contextos de comunicação face a face. O objetivo do presente trabalho é descrever e analisar os padrões comunicativos de duas crianças de doze anos de idade, Tereza, com paralisia cerebral não oralizada que faz uso de sistema alternativo de comunicação, e Alicia, com desenvolvimento normal e que faz uso da fala (sujeito controle). Este estudo faz parte de um projeto transcultural cujo objetivo é descrever como ocorre a compreensão e a expressão de determinados tipos de enunciados gráficos em crianças e jovens de diferentes idades e em diferentes países que utilizam sistemas alternativos de comunicação, e como estes enunciados são compreendidos por seus parceiros - pais, professores e pares. O sistema de comunicação utilizado pela criança com paralisia cerebral consistia de fotografias e do sistema PCS (Picture Communication System), no formato de um livro de comunicação. Para a coleta de dados foram utilizados os seguintes instrumentos: entrevistas semi-estruturadas com os pais e professora de Tereza, Tereza e Alicia; avaliação do sistema de comunicação e da educação da criança realizada pelos pais e pela professora de Tereza; instrumentos normatizados de avaliação da inteligência, da linguagem receptiva, aplicados em ambas as participantes; instrumento aplicado em Tereza para avaliar suas habilidades motoras; tarefas comunicativas aplicadas às duas meninas (provas de compreensão e produção). Os dados revelaram maior competência e conhecimento da mãe quanto ao uso do sistema de comunicação alternativa, bem como no favorecimento do desenvolvimento da linguagem alternativa da criança especial. O envolvimento da professora quanto ao emprego da comunicação alternativa por Tereza em sala de aula foi limitado. Os dados também ressaltaram dificuldades na linguagem compreensiva e expressiva de Tereza que pareceram estar relacionadas à falta de vivência, ao reduzido uso da linguagem alternativa por parte dos interlocutores da criança, bem como à diferença entre as organizações sintáticas da linguagem gráfica e da linguagem oral. Os resultados revelaram portanto a dificuldade de Tereza nas tarefas comunicativas, mas também apontaram para a necessidade de um treinamento mais sistemático no uso desses sistemas direcionados a esses jovens especiais e seus interlocutores.