42 resultados para Speaker verification
em Consorci de Serveis Universitaris de Catalunya (CSUC), Spain
Resumo:
Biometric system performance can be improved by means of data fusion. Several kinds of information can be fused in order to obtain a more accurate classification (identification or verification) of an input sample. In this paper we present a method for computing the weights in a weighted sum fusion for score combinations, by means of a likelihood model. The maximum likelihood estimation is set as a linear programming problem. The scores are derived from a GMM classifier working on a different feature extractor. Our experimental results assesed the robustness of the system in front a changes on time (different sessions) and robustness in front a change of microphone. The improvements obtained were significantly better (error bars of two standard deviations) than a uniform weighted sum or a uniform weighted product or the best single classifier. The proposed method scales computationaly with the number of scores to be fussioned as the simplex method for linear programming.
Resumo:
In this paper we consider a representative a priori unstable Hamiltonian system with 2+1/2 degrees of freedom, to which we apply the geometric mechanism for diffusion introduced in the paper Delshams et al., Mem.Amer.Math. Soc. 2006, and generalized in Delshams and Huguet, Nonlinearity 2009, and provide explicit, concrete and easily verifiable conditions for the existence of diffusing orbits. The simplification of the hypotheses allows us to perform explicitly the computations along the proof, which contribute to present in an easily understandable way the geometric mechanism of diffusion. In particular, we fully describe the construction of the scattering map and the combination of two types of dynamics on a normally hyperbolic invariant manifold.
Resumo:
La interacció home-màquina per mitjà de la veu cobreix moltes àrees d’investigació. Es destaquen entre altres, el reconeixement de la parla, la síntesis i identificació de discurs, la verificació i identificació de locutor i l’activació per veu (ordres) de sistemes robòtics. Reconèixer la parla és natural i simple per a les persones, però és un treball complex per a les màquines, pel qual existeixen diverses metodologies i tècniques, entre elles les Xarxes Neuronals. L’objectiu d’aquest treball és desenvolupar una eina en Matlab per al reconeixement i identificació de paraules pronunciades per un locutor, entre un conjunt de paraules possibles, i amb una bona fiabilitat dins d’uns marges preestablerts. El sistema és independent del locutor que pronuncia la paraula, és a dir, aquest locutor no haurà intervingut en el procés d’entrenament del sistema. S’ha dissenyat una interfície que permet l’adquisició del senyal de veu i el seu processament mitjançant xarxes neuronals i altres tècniques. Adaptant una part de control al sistema, es podria utilitzar per donar ordres a un robot com l’Alfa6Uvic o qualsevol altre dispositiu.
Resumo:
We have designed and built an experimental device, which we called a "thermoelectric bridge." Its primary purpose is simultaneous measurement of the relative Peltier and Seebeck coefficients. The systematic errors for both coefficients are equal with this device and manipulation is not necessary between the measurement of one coefficient and the other. Thus, this device is especially suitable for verifying their linear relation postulated by Lord Kelvin. Also, simultaneous measurement of thermal conductivity is described in the text. A sample is made up of the couple nickel¿platinum, taking measurements in the range of ¿20¿60°C and establishing the dependence of each coefficient with temperature, with nearly equal random errors ±0.2%, and systematic errors estimated at ¿0.5%. The aforementioned Kelvin relation is verified in this range from these results, proving that the behavioral deviations are ¿0.3% contained in the uncertainty ±0.5% caused by the propagation of errors
Resumo:
In this paper we propose the inversion of nonlinear distortions in order to improve the recognition rates of a speaker recognizer system. We study the effect of saturations on the test signals, trying to take into account real situations where the training material has been recorded in a controlled situation but the testing signals present some mismatch with the input signal level (saturations). The experimental results for speaker recognition shows that a combination of several strategies can improve the recognition rates with saturated test sentences from 80% to 89.39%, while the results with clean speech (without saturation) is 87.76% for one microphone, and for speaker identification can reduce the minimum detection cost function with saturated test sentences from 6.42% to 4.15%, while the results with clean speech (without saturation) is 5.74% for one microphone and 7.02% for the other one.
Resumo:
In this paper we propose the inversion of nonlinear distortions in order to improve the recognition rates of a speaker recognizer system. We study the effect of saturations on the test signals, trying to take into account real situations where the training material has been recorded in a controlled situation but the testing signals present some mismatch with the input signal level (saturations). The experimental results shows that a combination of several strategies can improve the recognition rates with saturated test sentences from 80% to 89.39%, while the results with clean speech (without saturation) is 87.76% for one microphone.
Resumo:
The aim of this study is to define a new statistic, PVL, based on the relative distance between the likelihood associated with the simulation replications and the likelihood of the conceptual model. Our results coming from several simulation experiments of a clinical trial show that the PVL statistic range can be a good measure of stability to establish when a computational model verifies the underlying conceptual model. PVL improves also the analysis of simulation replications because only one statistic is associated with all the simulation replications. As well it presents several verification scenarios, obtained by altering the simulation model, that show the usefulness of PVL. Further simulation experiments suggest that a 0 to 20 % range may define adequate limits for the verification problem, if considered from the viewpoint of an equivalence test.
Resumo:
La interacció home-màquina per mitjà de la veu cobreix moltes àrees d’investigació. Es destaquen entre altres, el reconeixement de la parla, la síntesis i identificació de discurs, la verificació i identificació de locutor i l’activació per veu (ordres) de sistemes robòtics. Reconèixer la parla és natural i simple per a les persones, però és un treball complex per a les màquines, pel qual existeixen diverses metodologies i tècniques, entre elles les Xarxes Neuronals. L’objectiu d’aquest treball és desenvolupar una eina en Matlab per al reconeixement i identificació de paraules pronunciades per un locutor, entre un conjunt de paraules possibles, i amb una bona fiabilitat dins d’uns marges preestablerts. El sistema és independent del locutor que pronuncia la paraula, és a dir, aquest locutor no haurà intervingut en el procés d’entrenament del sistema. S’ha dissenyat una interfície que permet l’adquisició del senyal de veu i el seu processament mitjançant xarxes neuronals i altres tècniques. Adaptant una part de control al sistema, es podria utilitzar per donar ordres a un robot com l’Alfa6Uvic o qualsevol altre dispositiu.
Resumo:
En el marco del proyecto “La ciutat romana de Cosa: arqueologia d’un enclau comercial mediterrani” , autorizado y apoyado por la Soprintendenza Archeologica por la Toscana, entre los dias 4 y 22 de septiembre de 2006 se ha realizado la segunda campaña de intervenciones arqueológicas en la ciudad romana de Cosa (Ansedonia, prov. Grosseto, Itàlia), colonia latina fundada en el 273 aC a unos 120 km. al norte de Roma. De acuerdo a los resultados obtenidos en la campanya del 2005 (localización/verificación de los límites precisos de la ínsula O-P/4-5 mediante la aplicación de técnicas de prospección geofísica completadas con la limpieza, registro y documentación arqueológica de las estructuras localizadas ) los trabajos del 2006 se han orientado hacia la identificación de la organización interna de la dicha ínsula tomando como referente el criptopórtico situado en el extremo N.E., el cual parece constituir el límite de una estructura singular (privada o pública ) estratégicamente ubicada en relación al fórum i a la Via Sacra. El trabajo de campo ha consistido en un intenso decapage con la finalidad de delimitar unidades de habitación complejas funcionalmente definidas y así la articulación existente entre ellas; en este sentido se ha podido documentar evidencias del espacio porticado superpuesto al criptopórtico así como, paralelamente a la calle 5 y en dirección a la Via Sacra, parte de habitaciones algunas de las cuales conservaban restos del pavimiento original, en un caso de mosaico. Paralelamente, se ha realizado el análisis en laboratorio de los materiales recuperados los cuales, aún procediendo de nivel superficial, empiezan a proporcionar datos sobre los diferentes momentos de ocupación de la zona, básicamente tardorepublicanos y augustales.
Resumo:
El projecte que es presenta a continuació, té com a objectiu implementar un sistema HW/SW encastat en una FPGA, capaç d’executar funcions de control remot per infraroig en plataformes de televisió flexibles de Sony Corp. El disseny obtingut, s’incorporarà a un sistema més ampli de verificació i test de circuits impresos, dins del marc de producció SMD. La finalitat d’aquest projecte, és la realització d’un sistema flexible per a la implementació de comandaments de comunicació per infraroig amb circuits impresos. Prèviament, s’ha estudiat els conceptes bàsics referents a la implementació de sistemes amb FPGAs, la seva metodologia de desenvolupament i les principals característiques de la seva arquitectura. Com a especificacions, s’ha utilitzat l’estàndard de control remot per infraroig de Sony Corp SIRCS (Sony Infrared remote control system).
Resumo:
The work carried out during the 4 year research activity can be barely classified in two main lines. On the one hand, a considerable effort is taken to address issues related with the verification of multi-dimensional and transient solutions that are obtained by numerical simulations. Within the studied cases, we can consider cases of piston-cylinder ows within geometries similar to those of hermetic reciprocating compressors.This issue is mentioned in Part I. On the other hand, numerical simulations of different phenomena have been performed. More emphasis has been given to the natural convection ow within enclosures. This is explained in Part II. The case extensively studied has been the natural convection ow. The natural convection ow within enclosures has attracted the attention of many researchers due to its potential to model numerous applications of engineering interest, such as cooling of electronic devices, air ow in buildings, heat transfer in solar collectors, among others. The natural convection studies corresponding to the parallelepipedic enclosures can be classified into two elementary classes: i) heating from a horizontal wall (heating from below); ii) heating from a vertical wall. The characteristic example of the former case is the Rayleigh-B_enard ow, however this research is on the cavities heated from the side. This configuration is referred commonly as the differentially heated cavity.
Resumo:
El presente estudio está dedicado a analizar la traducción de la ironía en una obra de ficción literaria, más concretamente en los relatos satíricos de Mijaíl Zoschenko y Mijaíl Bulgákov en su versión castellana. Metodológicamente, el estudio presenta un enfoque pragmático, y se inscribe en las aportaciones pragmáticas de la segunda mitad del siglo XX, que permiten analizar el texto literario como un acto de comunicación y un discurso dialógico, inscribiéndolo en un contexto extralingúístico relevante. Abordaremos el análisis de lo "no dicho": el subtexto irónico que subyace como un significado implícito no-deducible de los medios lingüísticos en sí mismos, y donde cobran una gran importancia los factores comunicativos: la situación, la intención del hablante, el principio cooperativo (según Paul Grice) y toda una serie de presupuestos que pueden o no compartir los interlocutores. Partiendo del supuesto de la existencia de diferentes tipos textuales en toda traducción, la ficción literaria se abordará como un tipo de texto que presenta características particupares. En este sentido, el relato satírico de la época soviética se contempla como un género específico que implica, a su vez, una estrategia específica de traducción. Como es sabido, en los textos humorísticos predomina el efecto perlocutivo. Así pues, dependerá del tradutor que el texto transferido a otra cultura, y a menudo a otra época, consiga el mismo efecto humorístico, o similar, al que tuvo el original en su contexto histórico-cultural.
Resumo:
El objetivo de este proyecto ha consistido en realizar el análisis y diseño de una aplicación Web B2C, de forma que a partir de dicha documentación, se pueden iniciar las fases de implementación y verificación, antesde su puesta en producción.