11 resultados para Speaker

em Consorci de Serveis Universitaris de Catalunya (CSUC), Spain


Relevância:

20.00% 20.00%

Publicador:

Resumo:

Biometric system performance can be improved by means of data fusion. Several kinds of information can be fused in order to obtain a more accurate classification (identification or verification) of an input sample. In this paper we present a method for computing the weights in a weighted sum fusion for score combinations, by means of a likelihood model. The maximum likelihood estimation is set as a linear programming problem. The scores are derived from a GMM classifier working on a different feature extractor. Our experimental results assesed the robustness of the system in front a changes on time (different sessions) and robustness in front a change of microphone. The improvements obtained were significantly better (error bars of two standard deviations) than a uniform weighted sum or a uniform weighted product or the best single classifier. The proposed method scales computationaly with the number of scores to be fussioned as the simplex method for linear programming.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this paper we propose the inversion of nonlinear distortions in order to improve the recognition rates of a speaker recognizer system. We study the effect of saturations on the test signals, trying to take into account real situations where the training material has been recorded in a controlled situation but the testing signals present some mismatch with the input signal level (saturations). The experimental results for speaker recognition shows that a combination of several strategies can improve the recognition rates with saturated test sentences from 80% to 89.39%, while the results with clean speech (without saturation) is 87.76% for one microphone, and for speaker identification can reduce the minimum detection cost function with saturated test sentences from 6.42% to 4.15%, while the results with clean speech (without saturation) is 5.74% for one microphone and 7.02% for the other one.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this paper we propose the inversion of nonlinear distortions in order to improve the recognition rates of a speaker recognizer system. We study the effect of saturations on the test signals, trying to take into account real situations where the training material has been recorded in a controlled situation but the testing signals present some mismatch with the input signal level (saturations). The experimental results shows that a combination of several strategies can improve the recognition rates with saturated test sentences from 80% to 89.39%, while the results with clean speech (without saturation) is 87.76% for one microphone.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El presente estudio está dedicado a analizar la traducción de la ironía en una obra de ficción literaria, más concretamente en los relatos satíricos de Mijaíl Zoschenko y Mijaíl Bulgákov en su versión castellana. Metodológicamente, el estudio presenta un enfoque pragmático, y se inscribe en las aportaciones pragmáticas de la segunda mitad del siglo XX, que permiten analizar el texto literario como un acto de comunicación y un discurso dialógico, inscribiéndolo en un contexto extralingúístico relevante. Abordaremos el análisis de lo "no dicho": el subtexto irónico que subyace como un significado implícito no-deducible de los medios lingüísticos en sí mismos, y donde cobran una gran importancia los factores comunicativos: la situación, la intención del hablante, el principio cooperativo (según Paul Grice) y toda una serie de presupuestos que pueden o no compartir los interlocutores. Partiendo del supuesto de la existencia de diferentes tipos textuales en toda traducción, la ficción literaria se abordará como un tipo de texto que presenta características particupares. En este sentido, el relato satírico de la época soviética se contempla como un género específico que implica, a su vez, una estrategia específica de traducción. Como es sabido, en los textos humorísticos predomina el efecto perlocutivo. Así pues, dependerá del tradutor que el texto transferido a otra cultura, y a menudo a otra época, consiga el mismo efecto humorístico, o similar, al que tuvo el original en su contexto histórico-cultural.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A new multimodal biometric database designed and acquired within the framework of the European BioSecure Network of Excellence is presented. It is comprised of more than 600 individuals acquired simultaneously in three scenarios: 1) over the Internet, 2) in an office environment with desktop PC, and 3) in indoor/outdoor environments with mobile portable hardware. The three scenarios include a common part of audio/video data. Also, signature and fingerprint data have been acquired both with desktop PC and mobile portable hardware. Additionally, hand and iris data were acquired in the second scenario using desktop PC. Acquisition has been conducted by 11 European institutions. Additional features of the BioSecure Multimodal Database (BMDB) are: two acquisitionsessions, several sensors in certain modalities, balanced gender and age distributions, multimodal realistic scenarios with simple and quick tasks per modality, cross-European diversity, availability of demographic data, and compatibility with other multimodal databases. The novel acquisition conditions of the BMDB allow us to perform new challenging research and evaluation of eithermonomodal or multimodal biometric systems, as in the recent BioSecure Multimodal Evaluation campaign. A description of this campaign including baseline results of individual modalities from the new database is also given. The database is expected to beavailable for research purposes through the BioSecure Association during 2008.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La interacció home-màquina per mitjà de la veu cobreix moltes àrees d’investigació. Es destaquen entre altres, el reconeixement de la parla, la síntesis i identificació de discurs, la verificació i identificació de locutor i l’activació per veu (ordres) de sistemes robòtics. Reconèixer la parla és natural i simple per a les persones, però és un treball complex per a les màquines, pel qual existeixen diverses metodologies i tècniques, entre elles les Xarxes Neuronals. L’objectiu d’aquest treball és desenvolupar una eina en Matlab per al reconeixement i identificació de paraules pronunciades per un locutor, entre un conjunt de paraules possibles, i amb una bona fiabilitat dins d’uns marges preestablerts. El sistema és independent del locutor que pronuncia la paraula, és a dir, aquest locutor no haurà intervingut en el procés d’entrenament del sistema. S’ha dissenyat una interfície que permet l’adquisició del senyal de veu i el seu processament mitjançant xarxes neuronals i altres tècniques. Adaptant una part de control al sistema, es podria utilitzar per donar ordres a un robot com l’Alfa6Uvic o qualsevol altre dispositiu.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El creciente número de hablantes no nativos de inglés en el mundo constituye la base a partir de la cual se han hecho recientes afirmaciones alrededor de la necesidad de enfatizar el papel del inglés como lingua franca en las clases de inglés. Este artículo investiga la visión de los profesores catalanes de inglés al respecto mediante un cuestionario centrado en aspectos como la preferencia de profesores nativos o no nativos, el conocimiento cultural idóneo para el profeso- rado de inglés, y la variedad de inglés escogida. Los resultados indican que el profesorado está influido por la supremacía del hablante nativo y una visión del inglés todavía restringida a las comunidades de hablantes nativos, con algunas diferencias significativas encontradas entre distintos grupos de profesores.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Social interactions are a very important component in people"s lives. Social network analysis has become a common technique used to model and quantify the properties of social interactions. In this paper, we propose an integrated framework to explore the characteristics of a social network extracted from multimodal dyadic interactions. For our study, we used a set of videos belonging to New York Times" Blogging Heads opinion blog. The Social Network is represented as an oriented graph, whose directed links are determined by the Influence Model. The links" weights are a measure of the"influence" a person has over the other. The states of the Influence Model encode automatically extracted audio/visual features from our videos using state-of-the art algorithms. Our results are reported in terms of accuracy of audio/visual data fusion for speaker segmentation and centrality measures used to characterize the extracted social network.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Aquest treball pretén ser l’estudi i la correcció fonètica d’un parlant de castellà com a primera llengua que té la llengua catalana coma segona llengua i presenta un problema a l’hora de pronunciar les laterals palatals. Per tant, és l’estudi d’un cas molt concret. Per a fer aquest estudi s’ha seguit el mètode verbotonal de correcció fonètica, ja que també es pretén comprovar la funcionalitat d’aquest mètode i els resultats possibles

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La interacció home-màquina per mitjà de la veu cobreix moltes àrees d’investigació. Es destaquen entre altres, el reconeixement de la parla, la síntesis i identificació de discurs, la verificació i identificació de locutor i l’activació per veu (ordres) de sistemes robòtics. Reconèixer la parla és natural i simple per a les persones, però és un treball complex per a les màquines, pel qual existeixen diverses metodologies i tècniques, entre elles les Xarxes Neuronals. L’objectiu d’aquest treball és desenvolupar una eina en Matlab per al reconeixement i identificació de paraules pronunciades per un locutor, entre un conjunt de paraules possibles, i amb una bona fiabilitat dins d’uns marges preestablerts. El sistema és independent del locutor que pronuncia la paraula, és a dir, aquest locutor no haurà intervingut en el procés d’entrenament del sistema. S’ha dissenyat una interfície que permet l’adquisició del senyal de veu i el seu processament mitjançant xarxes neuronals i altres tècniques. Adaptant una part de control al sistema, es podria utilitzar per donar ordres a un robot com l’Alfa6Uvic o qualsevol altre dispositiu.