813 resultados para emotional speech


Relevância:

20.00% 20.00%

Publicador:

Resumo:

Lors d'une intervention conversationnelle, le langage est supporté par une communication non-verbale qui joue un rôle central dans le comportement social humain en permettant de la rétroaction et en gérant la synchronisation, appuyant ainsi le contenu et la signification du discours. En effet, 55% du message est véhiculé par les expressions faciales, alors que seulement 7% est dû au message linguistique et 38% au paralangage. L'information concernant l'état émotionnel d'une personne est généralement inférée par les attributs faciaux. Cependant, on ne dispose pas vraiment d'instruments de mesure spécifiquement dédiés à ce type de comportements. En vision par ordinateur, on s'intéresse davantage au développement de systèmes d'analyse automatique des expressions faciales prototypiques pour les applications d'interaction homme-machine, d'analyse de vidéos de réunions, de sécurité, et même pour des applications cliniques. Dans la présente recherche, pour appréhender de tels indicateurs observables, nous essayons d'implanter un système capable de construire une source consistante et relativement exhaustive d'informations visuelles, lequel sera capable de distinguer sur un visage les traits et leurs déformations, permettant ainsi de reconnaître la présence ou absence d'une action faciale particulière. Une réflexion sur les techniques recensées nous a amené à explorer deux différentes approches. La première concerne l'aspect apparence dans lequel on se sert de l'orientation des gradients pour dégager une représentation dense des attributs faciaux. Hormis la représentation faciale, la principale difficulté d'un système, qui se veut être général, est la mise en œuvre d'un modèle générique indépendamment de l'identité de la personne, de la géométrie et de la taille des visages. La démarche qu'on propose repose sur l'élaboration d'un référentiel prototypique à partir d'un recalage par SIFT-flow dont on démontre, dans cette thèse, la supériorité par rapport à un alignement conventionnel utilisant la position des yeux. Dans une deuxième approche, on fait appel à un modèle géométrique à travers lequel les primitives faciales sont représentées par un filtrage de Gabor. Motivé par le fait que les expressions faciales sont non seulement ambigües et incohérentes d'une personne à une autre mais aussi dépendantes du contexte lui-même, à travers cette approche, on présente un système personnalisé de reconnaissance d'expressions faciales, dont la performance globale dépend directement de la performance du suivi d'un ensemble de points caractéristiques du visage. Ce suivi est effectué par une forme modifiée d'une technique d'estimation de disparité faisant intervenir la phase de Gabor. Dans cette thèse, on propose une redéfinition de la mesure de confiance et introduisons une procédure itérative et conditionnelle d'estimation du déplacement qui offrent un suivi plus robuste que les méthodes originales.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

La schizophrénie est une psychopathologie largement hétérogène caractérisée entre autres par d’importantes défaillances dans le fonctionnement cognitif et émotionnel. En effet, par rapport à la population générale, forte proportion de ces individus présentent une mémoire déficitaire pour les événements émotionnels. À ce jour, le peu d’études qui se sont penchées sur la mémoire émotionnelle épisodique dans la schizophrénie, ont uniquement mis l’emphase sur l'effet de la valence des stimuli (c’est-à-dire le caractère agréable ou désagréable du stimulus). Toutefois, aucune n’a investigué spécifiquement l’intensité de la réaction aux stimuli (c’est-à-dire une faible par rapport à une forte réaction) malgré quantité de preuves faisant montre, dans la population générale, de différents processus de mémoire émotionnelle pour des stimuli suscitant une forte réaction par rapport à ceux évoquant une faible réponse. Ce manque est d’autant plus flagrant étant donné le nombre d’études ayant rapporté un traitement et un encodage atypiques des émotions spécifiquement au niveau de l’intensité de la réponse subjective chez des patients atteints de schizophrénie. Autre fait important, il est étonnant de constater l’absence de recherches sur les différences de sexe dans la mémoire émotionnelle étant donné l’ensemble des divergences entre hommes et femmes atteints de schizophrénie au niveau de la prévalence, de l’âge de diagnostic, de la manifestation clinique, de l’évolution de la maladie, de la réponse au traitement et des structures cérébrales. Pour pallier à ces lacunes, ce mémoire a évalué : (1) l’effet de la valence des stimuli et de l'intensité de la réaction émotionnelle au niveau des fonctions cérébrales correspondant à la mémoire émotionnelle chez des patients atteints de schizophrénie comparativement à des participants sains; et (2) les possibles différences de sexe dans les processus cérébraux impliqués dans la mémoire émotionnelle chez des patients atteints de schizophrénie par rapport à des volontaires sains. Ainsi, la première étude a comparé les activations cérébrales de patients atteints de schizophrénie par rapport à des participants sains au cours d’une tâche de mémoire émotionnelle dont les stimuli variaient à la fois au niveau de la valence et de l'intensité de la réaction subjective. 37 patients atteints de schizophrénie ainsi que 37 participants en bonne santé ont effectué cette tâche de mémoire émotionnelle lors d’une session d’imagerie par résonance magnétique fonctionnelle (IRMf). Pour toutes les conditions étudiées (images négatives, positives, de faible et de forte intensité), le groupe atteint de schizophrénie a performé significativement moins bien que les volontaires sains. Comparativement aux sujets sains, ils ont montré moins d’activations cérébrales dans les régions limbiques et préfrontales lors de la reconnaissance des images négatives, mais ont présenté un patron d'activations similaire à celui des participants sains lors de la reconnaissance des images chargées positivement (activations observées dans le cervelet, le cortex temporal et préfrontal). Enfin, indépendamment de la valence des stimuli, les deux groupes ont démontré une augmentation des activations cérébrales pour les images de forte intensité par rapport à celles de plus faible intensité. La seconde étude a quant à elle exploré les différences de sexe potentielles au niveau des activations cérébrales associées à la mémoire émotionnelle dans la schizophrénie et dans la population en général. Nous avons comparé 41 patients atteints de schizophrénie (20 femmes) à 41 participants en bonne santé (19 femmes) alors qu’ils effectuaient la même tâche de mémoire émotionnelle mentionnée plus haut. Or, pour cette étude, nous nous sommes concentrés sur les conditions suivantes : la reconnaissance d’images positives, négatives et neutres. Nous n'avons pas observé de différences entre les hommes et les femmes au niveau des performances à la tâche de mémoire pour aucune des conditions. En ce qui a trait aux données de neuroimagerie, comparativement aux femmes en bonne santé, celles atteintes de schizophrénie ont montré une diminution des activations cérébrales dans les régions corticales du système limbique (p. ex. cortex cingulaire moyen) et dans les régions sous-corticales (p. ex. amygdale) lors de la reconnaissance d'images négatives. Pour ce qui est de la condition positive, elles ont présenté, comparativement au groupe de femmes saines, des diminutions d’activations spécifiquement dans le cervelet ainsi que dans le gyrus frontal inférieur et moyen. Les hommes atteints de schizophrénie, eux, ont montré une augmentation d’activations par rapport aux hommes sains dans le gyrus préfrontal médian lors de la reconnaissance des stimuli négatifs ; ainsi que dans les régions pariétales, temporales et limbiques lors de la reconnaissance des stimuli positifs. Dans un autre ordre d’idées, notre analyse corrélationnelle a mis en évidence, chez les femmes, un lien significatif entre l’activité cérébrale et les symptômes au cours de la mémoire des stimuli positifs, alors que chez les hommes atteints schizophrénie, ce lien a été observé au cours de la mémoire des stimuli négatifs. Bref, l’ensemble de nos résultats suggère, chez les patients atteints de schizophrénie, un fonctionnement cérébral atypique spécifiquement lors de la reconnaissance d’images négatives, mais un fonctionnement intact lors de la reconnaissance de stimuli positifs. De plus, nous avons mis en évidence la présence de différences de sexe dans les activations cérébrales associées à la mémoire épisodique émotionnelle soulignant ainsi l'importance d’étudier séparément les hommes et les femmes atteints de schizophrénie dans le cadre de recherches sur les plans cognitif et émotionnel.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Ce mémoire, “Deictic Shifts and Discursive Strategies in Othello”, est une étude des outils linguistiques et les stratégies utilisées par les différents personnages de la pièce. Il explore la façon dont le texte est construit et les différentes techniques qui le régissent de l'intérieur. Il étudie également l'utilisation de certains outils tels que les déplacements, les références déictiques indexicaux, les actes de langage et la rhétorique, et la façon dont ils permettent aux intervenants d'obtenir des résultats différents en fonction de la situation où ils sont. Ce travail est divisé en trois chapitres: le premier est consacré aux discours publics où je trace les différentes techniques utilisées par les personnages tel que la monopolization de la parole, la défense ou la persuasion de leurs interlocuteurs. Le deuxième chapitre se concentre sur les discours orientés vers une seule personne et montre comment les discours peuvent être utilisés pour avoir un effet sur l’interlocuteur. La première partie de ce chapitre traite de la sémiotique de choc. La deuxième partie est consacrée à la sémiotique de la tromperie et de manipulation. Le dernier chapitre est consacré aux soliloques et met l'accent sur l'écart entre les paroles de Iago et les réponses émotionnelles ainsi que les changements dans la personnalité d'Othello et de l'effet connexe de ces changements sur sa langue.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Cette recherche s’inscrit dans la continuité de celles entreprises en vue d’éclaircir la question du processus de design, et plus spécialement le design architectural de la maison. Elle cherche aussi à développer la réflexivité du designer sur les actes qu’il pose en lui offrant un point de vue depuis l’angle de la psychanalyse. Elle vient rallonger les initiatives amenées par la troisième génération des recherches sur les méthodologies du design en s’intéressant à un volet, jusque-là, peu exploré : le processus inconscient du design architectural. Elle pose comme problématique la question des origines inconscientes du travail créatif chez le concepteur en architecture. La création étant un des sujets importants de la psychanalyse, plusieurs concepts psychanalytiques, comme la sublimation freudienne, l’abordent et tentent de l’expliquer. Le design étant une discipline de création, la psychanalyse peut nous renseigner sur le processus du design, et nous offrir la possibilité de l’observer et de l’approcher. La métaphore architecturale, utilisée pour rendre la théorie freudienne, est aussi le champ d’application de plusieurs théories et concepts psychanalytiques. L’architecture en général, et celle de la maison en particulier, en ce que cette dernière comporte comme investissement émotionnel personnel de la part de son concepteur, constructeur ou utilisateur, offrent un terrain où plusieurs des concepts psychanalytiques peuvent être observés et appliqués. Cette recherche va approcher l’exemple architectural selon les concepts développés par les trois théories psychanalytiques les plus importantes : freudienne, lacanienne et jungienne. L’application de ces concepts se fait par une "autoanalyse" qui met le designer en double posture : celle du sujet de la recherche et celle du chercheur, ce qui favorise hautement la réflexivité voulue. La libre association, une des méthodes de la psychanalyse, sera la première étape qui enclenchera le processus d’autoanalyse et l’accompagnera dans son développement. S’appliquant sur le discours et la forme de la maison, la libre association va chercher à distinguer plusieurs mécanismes psychiques susceptibles d’éclairer notre investigation. Les résultats de l’application des concepts freudiens viendront servir de base pour l’application, par la suite, des concepts de la théorie lacanienne et jungienne. Au terme de cette analyse, nous serions en mesure de présenter une modélisation du processus inconscient du design qui aurait conduit à la création de la maison prise en exemple. Nous découvrirons par cela la nature du processus inconscient qui précède et accompagne le travail créatif du designer. Nous verrons aussi comment ce processus se nourrit des expériences du designer qui remontent jusqu’aux premières années de son enfance. Ceci permettrait de rendre compte de la possibilité d’appliquer les concepts psychanalytiques sur le design architectural et, par ce fait, permettre de déterminer les éventuels façons de concevoir l’apport de la psychanalyse à la pratique de cette discipline qu’est le design ainsi que son enseignement.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Essai doctoral présenté à la Faculté des arts et des sciences en vue de l’obtention du grade de doctorat en psychologie clinique (D.Psy.)

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Essai doctoral présenté à la Faculté des Arts et des Sciences en vue de l’obtention du grade de Doctorat en Psychologie Clinique

Relevância:

20.00% 20.00%

Publicador:

Resumo:

La leptine circule en proportion de la masse graisseuse du corps et la transduction de son signal à travers la forme longue de son récepteur via un certain nombre de voies neurales , y compris MAPK, PI3-K ,AMPK et JAK2 - STAT3 . Il faut noter que STAT3 constitue une voie clée au récepteur de la leptine par laquelle la leptine module l'expression des gènes impliqués dans la régulation du bilan énergétique. La plupart des recherches ont porté sur la fonction du récepteur de la leptine au sein de l' hypothalamus, en particulier la fonction du récepteur de la leptine dans le noyau arqué. Toutefois, les récepteurs de la leptine sont également exprimés sur les neurones dopaminergiques de l'aire tégmentale ventrale et la leptine agit sur cette région du cerveau pour influencer la prise alimentaire, la motivation, la locomotion, l'anxiété et la transmission de la dopamine. De plus, la leptine active la STAT3 dans les dopaminergiques et GABAergiques populations neuronales. Bien que ces résultats contribuent à notre compréhension des multiples actions de la leptine dans le système nerveux central, il reste à résoudre les cellules et la signalisation du récepteur de la leptine qui sont responsables des effets neurocomportementaux de la leptine dans le mésencéphale. Visant à déterminer la contribution de la voie de signalisation STAT3 dans les neurones dopaminergiques du mésencéphale, nous avons généré une lignée de souris knockout conditionnel dans lequel l'activation du gène de STAT3 sur son résidu tyrosine 705 ( Tyr 705 ) est absent spécifiquement dans les neurones dopaminergiques. Avec l'utilisation de ce modèle de souris génétique, nous avons évalué l'impact de l'ablation de la signalisation STAT3 dans les neurones dopaminergiques sur un certain nombre de fonctions liées à la dopamine, y compris l'alimentation, la locomotion, les comportements liés à la récompense, l'émotion et la libération de dopamine dans le noyau accumbens. Fait intéressant, nous avons observé un dimorphisme sexuel dans le phénotype des souris STAT3DAT-KO. L'activation de la voie de signalisation STAT3 dans les neurones dopaminergiques est responsable de l'action de la leptine dans la réduction de la locomotion, récompense liée à l'activité physique, et de l'augmentation de la libération et de la disponibilité de la dopamine chez les souris mâles. Cependant, il ne module pas le comportement émotionnel. D'autre part, les souris femelles STAT3DAT-KO augmentent les niveaux d'anxiété et les niveaux plasmatiques de corticostérone, sans provoquer de changements de la dépression. Cependant, la perte d'activation de STAT3 dans les neurones dopaminergiques ne module pas le comportement locomoteur chez les souris femelles. Notamment, les actions de la leptine dans le mésencéphale pour influencer le comportement alimentaire ne sont pas médiées par l'activation de STAT3 dans les neurones dopaminergiques, considérant que les souris mâles et femelles ont un comportement alimentaire normal. Nos résultats démontrent que la voie de signalisation STAT3 dans les neurones dopaminergiques est responsable des effets anxiolytiques de la leptine, et soutient l'hypothèse que la leptine communique l'état d'énergie du corps (i.e. la relation entre la dépense et les apports énergétiques) pour les régions mésolimbiques pour atténuer les effets de motivation et de récompense de plusieurs comportements qui servent à réhabiliter ou à épuiser les réserves d'énergie. En outre, ce travail souligne l'importance d'étudier la modulation de la signalisation de la leptine dans différente types de cellules, afin d'identifier les voies de signalisation et les mécanismes cellulaires impliqués dans les différentes fonctions neuro-comportementales de la leptine.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Introduction Provoked vestibulodynia (PVD) is a highly prevalent and taxing female genital pain condition. Despite the intimate nature of this pain and the fact that affective factors such as anxiety have been shown to modulate its manifestations, no study has yet explored the emotional regulation of couples in which the woman suffers from PVD. Aim Ambivalence over emotional expression (AEE) is an emotional regulation variable that quantifies the extent to which a person is comfortable with the way she or he expresses emotions. We examined whether the dyadic AEE of couples in which the woman suffers from PVD was differentially associated with women's pain and couples' psychological, sexual, and relational functioning. Methods Couples (N = 254), in which the woman suffered from PVD, completed the AEE questionnaire. A couple typology of dyadic AEE was created. Main Outcome Measures Dependent measures for both members of the couple were the global measure of sexual satisfaction scale, the Beck depression inventory II, and the revised dyadic adjustment scale. The female sexual function index and the sexual history form were used to assess the sexual function of women and men, respectively. Women also completed the pain rating index of the McGill pain questionnaire. Results Couples, in which both partners were considered low on AEE, had the highest scores on sexual satisfaction (P = 0.02) and function (P < 0.01), the lowest depression scores (P < 0.01), and the best dyadic adjustment (P = 0.02). No difference in pain intensity was found between couples. Conclusions Findings suggest that, for couples in which the woman suffers from PVD, an emotional regulation that is low in ambivalence in both partners is associated with better psychological, sexual, and relational outcomes. Results indicate that emotional regulation may be important to consider in the assessment and treatment of couples coping with PVD.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Medical fields requires fast, simple and noninvasive methods of diagnostic techniques. Several methods are available and possible because of the growth of technology that provides the necessary means of collecting and processing signals. The present thesis details the work done in the field of voice signals. New methods of analysis have been developed to understand the complexity of voice signals, such as nonlinear dynamics aiming at the exploration of voice signals dynamic nature. The purpose of this thesis is to characterize complexities of pathological voice from healthy signals and to differentiate stuttering signals from healthy signals. Efficiency of various acoustic as well as non linear time series methods are analysed. Three groups of samples are used, one from healthy individuals, subjects with vocal pathologies and stuttering subjects. Individual vowels/ and a continuous speech data for the utterance of the sentence "iruvarum changatimaranu" the meaning in English is "Both are good friends" from Malayalam language are recorded using a microphone . The recorded audio are converted to digital signals and are subjected to analysis.Acoustic perturbation methods like fundamental frequency (FO), jitter, shimmer, Zero Crossing Rate(ZCR) were carried out and non linear measures like maximum lyapunov exponent(Lamda max), correlation dimension (D2), Kolmogorov exponent(K2), and a new measure of entropy viz., Permutation entropy (PE) are evaluated for all three groups of the subjects. Permutation Entropy is a nonlinear complexity measure which can efficiently distinguish regular and complex nature of any signal and extract information about the change in dynamics of the process by indicating sudden change in its value. The results shows that nonlinear dynamical methods seem to be a suitable technique for voice signal analysis, due to the chaotic component of the human voice. Permutation entropy is well suited due to its sensitivity to uncertainties, since the pathologies are characterized by an increase in the signal complexity and unpredictability. Pathological groups have higher entropy values compared to the normal group. The stuttering signals have lower entropy values compared to the normal signals.PE is effective in charaterising the level of improvement after two weeks of speech therapy in the case of stuttering subjects. PE is also effective in characterizing the dynamical difference between healthy and pathological subjects. This suggests that PE can improve and complement the recent voice analysis methods available for clinicians. The work establishes the application of the simple, inexpensive and fast algorithm of PE for diagnosis in vocal disorders and stuttering subjects.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

School of Management Studies, Cochin University of Science and Technology

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Emotional intelligence is very important in organisations and the ability to manage feelings and handle stress is an important aspect of El. Even though a number of studies have been done to prove that E1 is related to organisationally relevant variables like leadership effectiveness, job satisfaction, performance, career success etc., and the theoretical grounding for emotional intelligence-stress-relationship seems sound, only a few studies have been done to establish this linkage. This study is an attempt to measure emotional intelligence and organisational role stress of managers working in industrial organisations and to examine the relationship between Emotional Intelligence and Organisational Role Stress. It also attempts to explore the influence of personal and occupational variables viz., age, education, gender, marital status, experience, department, type of organisation and designation on emotional intelligence. The investigator has also examined the difference in the level of role stress experienced by junior, middle and senior-level managers. The main objective of the study is to examine the relationship between emotional intelligence and organisational role stress.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This thesis investigates the potential use of zerocrossing information for speech sample estimation. It provides 21 new method tn) estimate speech samples using composite zerocrossings. A simple linear interpolation technique is developed for this purpose. By using this method the A/D converter can be avoided in a speech coder. The newly proposed zerocrossing sampling theory is supported with results of computer simulations using real speech data. The thesis also presents two methods for voiced/ unvoiced classification. One of these methods is based on a distance measure which is a function of short time zerocrossing rate and short time energy of the signal. The other one is based on the attractor dimension and entropy of the signal. Among these two methods the first one is simple and reguires only very few computations compared to the other. This method is used imtea later chapter to design an enhanced Adaptive Transform Coder. The later part of the thesis addresses a few problems in Adaptive Transform Coding and presents an improved ATC. Transform coefficient with maximum amplitude is considered as ‘side information’. This. enables more accurate tfiiz assignment enui step—size computation. A new bit reassignment scheme is also introduced in this work. Finally, sum ATC which applies switching between luiscrete Cosine Transform and Discrete Walsh-Hadamard Transform for voiced and unvoiced speech segments respectively is presented. Simulation results are provided to show the improved performance of the coder

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Biometrics deals with the physiological and behavioral characteristics of an individual to establish identity. Fingerprint based authentication is the most advanced biometric authentication technology. The minutiae based fingerprint identification method offer reasonable identification rate. The feature minutiae map consists of about 70-100 minutia points and matching accuracy is dropping down while the size of database is growing up. Hence it is inevitable to make the size of the fingerprint feature code to be as smaller as possible so that identification may be much easier. In this research, a novel global singularity based fingerprint representation is proposed. Fingerprint baseline, which is the line between distal and intermediate phalangeal joint line in the fingerprint, is taken as the reference line. A polygon is formed with the singularities and the fingerprint baseline. The feature vectors are the polygonal angle, sides, area, type and the ridge counts in between the singularities. 100% recognition rate is achieved in this method. The method is compared with the conventional minutiae based recognition method in terms of computation time, receiver operator characteristics (ROC) and the feature vector length. Speech is a behavioural biometric modality and can be used for identification of a speaker. In this work, MFCC of text dependant speeches are computed and clustered using k-means algorithm. A backpropagation based Artificial Neural Network is trained to identify the clustered speech code. The performance of the neural network classifier is compared with the VQ based Euclidean minimum classifier. Biometric systems that use a single modality are usually affected by problems like noisy sensor data, non-universality and/or lack of distinctiveness of the biometric trait, unacceptable error rates, and spoof attacks. Multifinger feature level fusion based fingerprint recognition is developed and the performances are measured in terms of the ROC curve. Score level fusion of fingerprint and speech based recognition system is done and 100% accuracy is achieved for a considerable range of matching threshold

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This thesis investigated the potential use of Linear Predictive Coding in speech communication applications. A Modified Block Adaptive Predictive Coder is developed, which reduces the computational burden and complexity without sacrificing the speech quality, as compared to the conventional adaptive predictive coding (APC) system. For this, changes in the evaluation methods have been evolved. This method is as different from the usual APC system in that the difference between the true and the predicted value is not transmitted. This allows the replacement of the high order predictor in the transmitter section of a predictive coding system, by a simple delay unit, which makes the transmitter quite simple. Also, the block length used in the processing of the speech signal is adjusted relative to the pitch period of the signal being processed rather than choosing a constant length as hitherto done by other researchers. The efficiency of the newly proposed coder has been supported with results of computer simulation using real speech data. Three methods for voiced/unvoiced/silent/transition classification have been presented. The first one is based on energy, zerocrossing rate and the periodicity of the waveform. The second method uses normalised correlation coefficient as the main parameter, while the third method utilizes a pitch-dependent correlation factor. The third algorithm which gives the minimum error probability has been chosen in a later chapter to design the modified coder The thesis also presents a comparazive study beh-cm the autocorrelation and the covariance methods used in the evaluaiicn of the predictor parameters. It has been proved that the azztocorrelation method is superior to the covariance method with respect to the filter stabf-it)‘ and also in an SNR sense, though the increase in gain is only small. The Modified Block Adaptive Coder applies a switching from pitch precitzion to spectrum prediction when the speech segment changes from a voiced or transition region to an unvoiced region. The experiments cont;-:ted in coding, transmission and simulation, used speech samples from .\£=_‘ajr2_1a:r1 and English phrases. Proposal for a speaker reecgnifion syste: and a phoneme identification system has also been outlized towards the end of the thesis.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Speech processing and consequent recognition are important areas of Digital Signal Processing since speech allows people to communicate more natu-rally and efficiently. In this work, a speech recognition system is developed for re-cognizing digits in Malayalam. For recognizing speech, features are to be ex-tracted from speech and hence feature extraction method plays an important role in speech recognition. Here, front end processing for extracting the features is per-formed using two wavelet based methods namely Discrete Wavelet Transforms (DWT) and Wavelet Packet Decomposition (WPD). Naive Bayes classifier is used for classification purpose. After classification using Naive Bayes classifier, DWT produced a recognition accuracy of 83.5% and WPD produced an accuracy of 80.7%. This paper is intended to devise a new feature extraction method which produces improvements in the recognition accuracy. So, a new method called Dis-crete Wavelet Packet Decomposition (DWPD) is introduced which utilizes the hy-brid features of both DWT and WPD. The performance of this new approach is evaluated and it produced an improved recognition accuracy of 86.2% along with Naive Bayes classifier.