633 resultados para Nonnative speaker


Relevância:

10.00% 10.00%

Publicador:

Resumo:

A partir de considerar que el análisis interdisciplinario y crítico de las relaciones entre las estructuras y las estrategias del discurso, la cognición social, la interacción y las relaciones de la sociedad habilita al análisis del discurso a hacer aportes serios al estudio de estructuras, conflictos y problemas sociales. El objetivo de este trabajo es abordar el discurso que el ex presidente de la Nación, Néstor Kirchner, ha efectuado en distintos escenarios internacionales para determinar, dentro de los límites del corpus seleccionado, la correlación y la congruencia del mismo dentro y fuera de la región. Para ello, intentaremos descomponer su discurso en: los distintos componentes que articulan el enunciado y la enunciación, abordaremos estas a través de las marcas del hablante en el discurso, ubicaremos a los receptores del discurso e intentaremos explicar cómo estos recursos son utilizados argumentativamente hablando.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El encomio del trágico Agatón es un intermedio musical, una canción que detiene la avanzada conceptual del Banquete, pero con gravísimo poder proléptico. Se recupera todo lo dicho hasta allí, pero tergiversado por su enfoque de marcada impronta gorgiana. Cada comensal conlleva la concepción compuesta Amor-Belleza, donde todo amor es amor de cierta belleza. Distinguiendo el éros presentado por Agatón (erótica narcisista) intentaremos mostrar qué tipo de belleza nos presenta este comensal, y cuál es la poesía que le corresponde. Entonces se dará un agón paratextual, una referencia al gran combate que Platón sostuvo toda su vida: el conflicto entre filosofía y poesía. Mostraremos que Agatón, a la vez Narciso, poeta mimético, inspirado, poseso y cosmético, es la imagen del poeta que el filósofo ateniense detesta, que, como paradigma construido para este diálogo, tiene todos los defectos criticados a lo largo de la obra platónica y sirve para tematizar este enfrentamiento

Relevância:

10.00% 10.00%

Publicador:

Resumo:

En este trabajo enmarcado en la teoría funcional variacionista que relaciona forma, motivación y cultura, pretendemos mostrar cómo el hablante del siglo XIX en San Juan, Argentina, alterna en sus cartas familiares formas lingüísticas sintéticas y perifrásticas para referenciar el futuro, según sus propósitos comunicativos. El corpus, constituido por cartas escritas entre 1837 y 1889, se inserta en el 'siglo de las independencias políticas y las creaciones de los nuevos estados, en que comienza a gestarse la lucha por la identidad en América Latina' (Majfud, 2002). Consideramos que las construcciones alternantes no equivalen entre sí sintáctica, semántica ni pragmáticamente, siendo favorecidas por ciertos parámetros, de los cuales analizamos aquel por el cual creemos entró la innovación de la perífrasis 'ir a + infinitivo'. Adherimos al hecho de que 'las explicaciones funcionales de los cambios lingüísticos no excluyen, sino que implican, las explicaciones culturales' (Coseriu, 1977). Esta aproximación pragmática al uso lingüístico exige un análisis cualitativo y cuantitativo a la vez. 'Importará no sólo qué estructuras contiene la lengua, sino también, cuándo se recurre a ellas y, sobre todo, cuánto se recurre cuándo a qué estructura' (García, 1995)

Relevância:

10.00% 10.00%

Publicador:

Resumo:

The City Educator Program is articulated with PROEX-Pro - Deanship Culture and Student Affairs through the Directorate of Extension, along with the Institute of Geography, Faculty of Architecture, Urban Planning and Design Institute and the City Futura Pro. Program is conducted since 2008 by the Federal University of Uberlândia and Motion City Futura. The outreach program aims to promote democratic governance and smart planning municipal and regional level, enabling public and social (government technicians, law enforcement officers, and civil society leaders) seeking implementation of legal instruments, urban and tributaries in the counties of Araguari and Uberlândia, established in the City Statute and Master Plans, and the Fiscal Responsibility, Social Rights established by the Constitution, and all the instruments of social control in the municipalities involved. The methodology includes content developed through dynamic, research participant, group work and exposure dialogue. The results were relevant to holding the Course on Urban Management and Sustainable Democratic, Uberlândia A Forum for Sustainable Leadership Training Course Ethical and Sustainable, Community Workshops Seminars in Neighborhoods assessment; Map Workshop Speaker, Research Participants, Seminars and Interactive Campaigns Mobilization office in the territory. Were produced articles, reports and reflections that are public in book form. At the end of the implementation of program activities, the municipal governments, entities and non-governmental organizations as well as citizens who, directly or indirectly, involved with the program, attended the final seminar where, besides the presentation of results, was made, collectively, evaluation and assessment of all activities

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Este trabajo de investigación tiene por objeto demostrar que, dentro de un continuum que existe en la reformulación del discurso ajeno en el propio, donde se pasa de una forma a otra casi sin solución de continuidad, se puede hablar de una gradación entre un polo más objetivo (o con pretensión de mayor objetividad) a un polo más subjetivo, donde la interpretación tendría un papel más significativo. El polo más objetivo lo ubicaríamos en el extremo izquierdo y lo ejemplificaríamos con el discurso directo, mientras que el polo más subjetivo ocuparía el extremo derecho y estaría representado por el discurso narrativizado y las nominalizaciones citativas. En medio de estos dos polos se encontrarían todas las demás formas de discurso referido. En el campo del discurso periodístico, donde la investigación fue realizada, se pudo corroborar que existe, en la mayoría de los casos, una elección por parte del locutor (en este caso el periodista) de utilizar una forma u otra. Podría ser objetivo para posteriores estudios el de determinar el criterio que prevalece en esta elección.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A partir de considerar que el análisis interdisciplinario y crítico de las relaciones entre las estructuras y las estrategias del discurso, la cognición social, la interacción y las relaciones de la sociedad habilita al análisis del discurso a hacer aportes serios al estudio de estructuras, conflictos y problemas sociales. El objetivo de este trabajo es abordar el discurso que el ex presidente de la Nación, Néstor Kirchner, ha efectuado en distintos escenarios internacionales para determinar, dentro de los límites del corpus seleccionado, la correlación y la congruencia del mismo dentro y fuera de la región. Para ello, intentaremos descomponer su discurso en: los distintos componentes que articulan el enunciado y la enunciación, abordaremos estas a través de las marcas del hablante en el discurso, ubicaremos a los receptores del discurso e intentaremos explicar cómo estos recursos son utilizados argumentativamente hablando.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El encomio del trágico Agatón es un intermedio musical, una canción que detiene la avanzada conceptual del Banquete, pero con gravísimo poder proléptico. Se recupera todo lo dicho hasta allí, pero tergiversado por su enfoque de marcada impronta gorgiana. Cada comensal conlleva la concepción compuesta Amor-Belleza, donde todo amor es amor de cierta belleza. Distinguiendo el éros presentado por Agatón (erótica narcisista) intentaremos mostrar qué tipo de belleza nos presenta este comensal, y cuál es la poesía que le corresponde. Entonces se dará un agón paratextual, una referencia al gran combate que Platón sostuvo toda su vida: el conflicto entre filosofía y poesía. Mostraremos que Agatón, a la vez Narciso, poeta mimético, inspirado, poseso y cosmético, es la imagen del poeta que el filósofo ateniense detesta, que, como paradigma construido para este diálogo, tiene todos los defectos criticados a lo largo de la obra platónica y sirve para tematizar este enfrentamiento

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In this paper a layered architecture to spot and characterize vowel segments in running speech is presented. The detection process is based on neuromorphic principles, as is the use of Hebbian units in layers to implement lateral inhibition, band probability estimation and mutual exclusion. Results are presented showing how the association between the acoustic set of patterns and the phonologic set of symbols may be created. Possible applications of this methodology are to be found in speech event spotting, in the study of pathological voice and in speaker biometric characterization, among others.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In the last two decades, there has been an important increase in research on speech technology in Spain, mainly due to a higher level of funding from European, Spanish and local institutions and also due to a growing interest in these technologies for developing new services and applications. This paper provides a review of the main areas of speech technology addressed by research groups in Spain, their main contributions in the recent years and the main focus of interest these days. This description is classified in five main areas: audio processing including speech, speaker characterization, speech and language processing, text to speech conversion and spoken language applications. This paper also introduces the Spanish Network of Speech Technologies (RTTH. Red Temática en Tecnologías del Habla) as the research network that includes almost all the researchers working in this area, presenting some figures, its objectives and its main activities developed in the last years.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Voice biometry is classically based on the parameterization and patterning of speech features mainly. The present approach is based on the characterization of phonation features instead (glottal features). The intention is to reduce intra-speaker variability due to the `text'. Through the study of larynx biomechanics it may be seen that the glottal correlates constitute a family of 2-nd order gaussian wavelets. The methodology relies in the extraction of glottal correlates (the glottal source) which are parameterized using wavelet techniques. Classification and pattern matching was carried out using Gaussian Mixture Models. Data of speakers from a balanced database and NIST SRE HASR2 were used in verification experiments. Preliminary results are given and discussed.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In order to obtain more human like sounding humanmachine interfaces we must first be able to give them expressive capabilities in the way of emotional and stylistic features so as to closely adequate them to the intended task. If we want to replicate those features it is not enough to merely replicate the prosodic information of fundamental frequency and speaking rhythm. The proposed additional layer is the modification of the glottal model, for which we make use of the GlottHMM parameters. This paper analyzes the viability of such an approach by verifying that the expressive nuances are captured by the aforementioned features, obtaining 95% recognition rates on styled speaking and 82% on emotional speech. Then we evaluate the effect of speaker bias and recording environment on the source modeling in order to quantify possible problems when analyzing multi-speaker databases. Finally we propose a speaking styles separation for Spanish based on prosodic features and check its perceptual significance.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

En primer lugar se realiza una breve introducción a la historia del refuerzo sonoro, en el cual veremos cómo a ido evolucionando hasta lo que se conoce hoy en día como Line Array, luego nos centraremos en los factores acústicos a tener en cuenta, en ellos repasaremos los conceptos de fase y la importancia de este factor en cuanto a la interacción de más de altavoz, en esta parte también repasaremos como afectan las condiciones climáticas como la atenuación del aire y la temperatura, a la propagación de sonido. A continuación nos centraremos en el diseño de arreglos de altavoces, veremos las diferentes configuraciones para diferentes rangos de trabajo, veremos sus ventajas y desventajas de cada arreglo y también se verá la forma de controlar la directividad de los arreglos para optimizar la propagación del sonido en el área a cubrir, para terminar esta parte profundizaremos en el diseño de los sistemas Line Array, analizando su estructura interna para entender su comportamiento directivo y eficaz en cuanto a la propagación de ondas. Por último se hará el análisis de un montaje real, en el cual tuve participación directa en el montaje ya que la empresa para la que trabajaba se encargó de hacer la gira del grupo español Amaral. Esta gira se realiza en el año 2008-2009, gracias a esta experiencia he podido llevar a cabo este proyecto donde también he podido comprobar algunos conceptos empleados en el diseño de arreglos. De esta Gira, se analizará la efectividad y el rendimiento del diseño de arreglo empleado, para esto se generará mediante software de predicción acústica, el mapa de presión sonora generado por el diseño empleado, una vez visto los resultados, se planteará una reorganización del arreglo de altavoces, para poder conseguir un mejor rendimiento en el área a cubrir. ABSTRACT. First is a brief introduction to the history of sound reinforcement, in which we will see how to have evolved into what is known today as Line Array, then we will focus on acoustic factors to consider in they will review phase concepts and the importance of this factor as to the interaction of the speaker more in this part also review such as climatic conditions affecting air attenuation and temperature, to the propagation of sound. Here we focus on the speaker array design, we see the different configurations for different ranges of work, we will see the advantages and disadvantages of each arrangement and also see how to control the directivity of the arrays to optimize sound propagation in the area to be covered, to finish this part will delve into the design of line array systems, analyzing its internal structure to understand its behavior management and effective in terms of wave propagation. Finally, we will analyze a real assembly, which had direct involvement in the assembly as the company for which he worked was commissioned to do the tour of the Spanish group Amaral. This tour takes place in the year 2008-2009, thanks to this experience I have been able to conduct this project where I have seen also some concepts used in the array design. In this tour, we analyze the effectiveness and performance of the array design used for this is generated by acoustical prediction software, the map of sound pressure generated by the design employed, once seen the results, he will consider reorganization under speaker, in order to achieve better performance in the area to be covered.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La presente Tesis analiza las posibilidades que ofrecen en la actualidad las tecnologías del habla para la detección de patologías clínicas asociadas a la vía aérea superior. El estudio del habla que tradicionalmente cubre tanto la producción como el proceso de transformación del mensaje y las señales involucradas, desde el emisor hasta alcanzar al receptor, ofrece una vía de estudio alternativa para estas patologías. El hecho de que la señal emitida no solo contiene este mensaje, sino también información acerca del locutor, ha motivado el desarrollo de sistemas orientados a la identificación y verificación de la identidad de los locutores. Estos trabajos han recibido recientemente un nuevo impulso, orientándose tanto hacia la caracterización de rasgos que son comunes a varios locutores, como a las diferencias existentes entre grabaciones de un mismo locutor. Los primeros resultan especialmente relevantes para esta Tesis dado que estos rasgos podrían evidenciar la presencia de características relacionadas con una cierta condición común a varios locutores, independiente de su identidad. Tal es el caso que se enfrenta en esta Tesis, donde los rasgos identificados se relacionarían con una de la patología particular y directamente vinculada con el sistema de físico de conformación del habla. El caso del Síndrome de Apneas Hipopneas durante el Sueno (SAHS) resulta paradigmático. Se trata de una patología con una elevada prevalencia mundo, que aumenta con la edad. Los pacientes de esta patología experimentan episodios de cese involuntario de la respiración durante el sueño, que se prolongan durante varios segundos y que se reproducen a lo largo de la noche impidiendo el correcto descanso. En el caso de la apnea obstructiva, estos episodios se deben a la imposibilidad de mantener un camino abierto a través de la vía aérea, de forma que el flujo de aire se ve interrumpido. En la actualidad, el diagnostico de estos pacientes se realiza a través de un estudio polisomnográfico, que se centra en el análisis de los episodios de apnea durante el sueño, requiriendo que el paciente permanezca en el hospital durante una noche. La complejidad y el elevado coste de estos procedimientos, unidos a las crecientes listas de espera, han evidenciado la necesidad de contar con técnicas rápidas de detección, que si bien podrían no obtener tasas tan elevadas, permitirían reorganizar las listas de espera en función del grado de severidad de la patología en cada paciente. Entre otros, los sistemas de diagnostico por imagen, así como la caracterización antropométrica de los pacientes, han evidenciado la existencia de patrones anatómicos que tendrían influencia directa sobre el habla. Los trabajos dedicados al estudio del SAHS en lo relativo a como esta afecta al habla han sido escasos y algunos de ellos incluso contradictorios. Sin embargo, desde finales de la década de 1980 se conoce la existencia de patrones específicos relativos a la articulación, la fonación y la resonancia. Sin embargo, su descripción resultaba difícilmente aprovechable a través de un sistema de reconocimiento automático, pero apuntaba la existencia de un nexo entre voz y SAHS. En los últimos anos las técnicas de procesado automático han permitido el desarrollo de sistemas automáticos que ya son capaces de identificar diferencias significativas en el habla de los pacientes del SAHS, y que los distinguen de los locutores sanos. Por contra, poco se conoce acerca de la conexión entre estos nuevos resultados, los sé que habían obtenido en el pasado y la patogénesis del SAHS. Esta Tesis continua la labor desarrollada en este ámbito considerando específicamente: el estudio de la forma en que el SAHS afecta el habla de los pacientes, la mejora en las tasas de clasificación automática y la combinación de la información obtenida con los predictores utilizados por los especialistas clínicos en sus evaluaciones preliminares. Las dos primeras tareas plantean problemas simbióticos, pero diferentes. Mientras el estudio de la conexión entre el SAHS y el habla requiere de modelos acotados que puedan ser interpretados con facilidad, los sistemas de reconocimiento se sirven de un elevado número de dimensiones para la caracterización y posterior identificación de patrones. Así, la primera tarea debe permitirnos avanzar en la segunda, al igual que la incorporación de los predictores utilizados por los especialistas clínicos. La Tesis aborda el estudio tanto del habla continua como del habla sostenida, con el fin de aprovechar las sinergias y diferencias existentes entre ambas. En el análisis del habla continua se tomo como punto de partida un esquema que ya fue evaluado con anterioridad, y sobre el cual se ha tratado la evaluación y optimización de la representación del habla, así como la caracterización de los patrones específicos asociados al SAHS. Ello ha evidenciado la conexión entre el SAHS y los elementos fundamentales de la señal de voz: los formantes. Los resultados obtenidos demuestran que el éxito de estos sistemas se debe, fundamentalmente, a la capacidad de estas representaciones para describir dichas componentes, obviando las dimensiones ruidosas o con poca capacidad discriminativa. El esquema resultante ofrece una tasa de error por debajo del 18%, sirviéndose de clasificadores notablemente menos complejos que los descritos en el estado del arte y de una única grabación de voz de corta duración. En relación a la conexión entre el SAHS y los patrones observados, fue necesario considerar las diferencias inter- e intra-grupo, centrándonos en la articulación característica del locutor, sustituyendo los complejos modelos de clasificación por el estudio de los promedios espectrales. El resultado apunta con claridad hacia ciertas regiones del eje de frecuencias, sugiriendo la existencia de un estrechamiento sistemático en la sección del tracto en la región de la orofaringe, ya prevista en la patogénesis de este síndrome. En cuanto al habla sostenida, se han reproducido los estudios realizados sobre el habla continua en grabaciones de la vocal /a/ sostenida. Los resultados son cualitativamente análogos a los anteriores, si bien en este caso las tasas de clasificación resultan ser más bajas. Con el objetivo de identificar el sentido de este resultado se reprodujo el estudio de los promedios espectrales y de la variabilidad inter e intra-grupo. Ambos estudios mostraron importantes diferencias con los anteriores que podrían explicar estos resultados. Sin embargo, el habla sostenida ofrece otras oportunidades al establecer un entorno controlado para el estudio de la fonación, que también había sido identificada como una fuente de información para la detección del SAHS. De su estudio se pudo observar que, en el conjunto de datos disponibles, no existen variaciones que pudieran asociarse fácilmente con la fonación. Únicamente aquellas dimensiones que describen la distribución de energía a lo largo del eje de frecuencia evidenciaron diferencias significativas, apuntando, una vez más, en la dirección de las resonancias espectrales. Analizados los resultados anteriores, la Tesis afronta la fusión de ambas fuentes de información en un único sistema de clasificación. Con ello es posible mejorar las tasas de clasificación, bajo la hipótesis de que la información presente en el habla continua y el habla sostenida es fundamentalmente distinta. Esta tarea se realizo a través de un sencillo esquema de fusión que obtuvo un 88.6% de aciertos en clasificación (tasa de error del 11.4%), lo que representa una mejora significativa respecto al estado del arte. Finalmente, la combinación de este clasificador con los predictores utilizados por los especialistas clínicos ofreció una tasa del 91.3% (tasa de error de 8.7%), que se encuentra dentro del margen ofrecido por esquemas más costosos e intrusivos, y que a diferencia del propuesto, no pueden ser utilizados en la evaluación previa de los pacientes. Con todo, la Tesis ofrece una visión clara sobre la relación entre el SAHS y el habla, evidenciando el grado de madurez alcanzado por la tecnología del habla en la caracterización y detección del SAHS, poniendo de manifiesto que su uso para la evaluación de los pacientes ya sería posible, y dejando la puerta abierta a futuras investigaciones que continúen el trabajo aquí iniciado. ABSTRACT This Thesis explores the potential of speech technologies for the detection of clinical disorders connected to the upper airway. The study of speech traditionally covers both the production process and post processing of the signals involved, from the speaker up to the listener, offering an alternative path to study these pathologies. The fact that utterances embed not just the encoded message but also information about the speaker, has motivated the development of automatic systems oriented to the identification and verificaton the speaker’s identity. These have recently been boosted and reoriented either towards the characterization of traits that are common to several speakers, or to the differences between records of the same speaker collected under different conditions. The first are particularly relevant to this Thesis as these patterns could reveal the presence of features that are related to a common condition shared among different speakers, regardless of their identity. Such is the case faced in this Thesis, where the traits identified would relate to a particular pathology, directly connected to the speech production system. The Obstructive Sleep Apnea syndrome (OSA) is a paradigmatic case for analysis. It is a disorder with high prevalence among adults and affecting a larger number of them as they grow older. Patients suffering from this disorder experience episodes of involuntary cessation of breath during sleep that may last a few seconds and reproduce throughout the night, preventing proper rest. In the case of obstructive apnea, these episodes are related to the collapse of the pharynx, which interrupts the air flow. Currently, OSA diagnosis is done through a polysomnographic study, which focuses on the analysis of apnea episodes during sleep, requiring the patient to stay at the hospital for the whole night. The complexity and high cost of the procedures involved, combined with the waiting lists, have evidenced the need for screening techniques, which perhaps would not achieve outstanding performance rates but would allow clinicians to reorganize these lists ranking patients according to the severity of their condition. Among others, imaging diagnosis and anthropometric characterization of patients have evidenced the existence of anatomical patterns related to OSA that have direct influence on speech. Contributions devoted to the study of how this disorder affects scpeech are scarce and somehow contradictory. However, since the late 1980s the existence of specific patterns related to articulation, phonation and resonance is known. By that time these descriptions were virtually useless when coming to the development of an automatic system, but pointed out the existence of a link between speech and OSA. In recent years automatic processing techniques have evolved and are now able to identify significant differences in the speech of OSAS patients when compared to records from healthy subjects. Nevertheless, little is known about the connection between these new results with those published in the past and the pathogenesis of the OSA syndrome. This Thesis is aimed to progress beyond the previous research done in this area by addressing: the study of how OSA affects patients’ speech, the enhancement of automatic OSA classification based on speech analysis, and its integration with the information embedded in the predictors generally used by clinicians in preliminary patients’ examination. The first two tasks, though may appear symbiotic at first, are quite different. While studying the connection between speech and OSA requires simple narrow models that can be easily interpreted, classification requires larger models including a large number dimensions for the characterization and posterior identification of the observed patterns. Anyhow, it is clear that any progress made in the first task should allow us to improve our performance on the second one, and that the incorporation of the predictors used by clinicians shall contribute in this same direction. The Thesis considers both continuous and sustained speech analysis, to exploit the synergies and differences between them. On continuous speech analysis, a conventional speech processing scheme, designed and evaluated before this Thesis, was taken as a baseline. Over this initial system several alternative representations of the speech information were proposed, optimized and tested to select those more suitable for the characterization of OSA-specific patterns. Evidences were found on the existence of a connection between OSA and the fundamental constituents of the speech: the formants. Experimental results proved that the success of the proposed solution is well explained by the ability of speech representations to describe these specific OSA-related components, ignoring the noisy ones as well those presenting low discrimination capabilities. The resulting scheme obtained a 18% error rate, on a classification scheme significantly less complex than those described in the literature and operating on a single speech record. Regarding the connection between OSA and the observed patterns, it was necessary to consider inter-and intra-group differences for this analysis, and to focus on the articulation, replacing the complex classification models by the long-term average spectra. Results clearly point to certain regions on the frequency axis, suggesting the existence of a systematic narrowing in the vocal tract section at the oropharynx. This was already described in the pathogenesis of this syndrome. Regarding sustained speech, similar experiments as those conducted on continuous speech were reproduced on sustained phonations of vowel / a /. Results were qualitatively similar to the previous ones, though in this case perfomance rates were found to be noticeably lower. Trying to derive further knowledge from this result, experiments on the long-term average spectra and intraand inter-group variability ratios were also reproduced on sustained speech records. Results on both experiments showed significant differences from the previous ones obtained from continuous speech which could explain the differences observed on peformance. However, sustained speech also provided the opportunity to study phonation within the controlled framework it provides. This was also identified in the literature as a source of information for the detection of OSA. In this study it was found that, for the available dataset, no sistematic differences related to phonation could be found between the two groups of speakers. Only those dimensions which relate energy distribution along the frequency axis provided significant differences, pointing once again towards the direction of resonant components. Once classification schemes on both continuous and sustained speech were developed, the Thesis addressed their combination into a single classification system. Under the assumption that the information in continuous and sustained speech is fundamentally different, it should be possible to successfully merge the two of them. This was tested through a simple fusion scheme which obtained a 88.6% correct classification (11.4% error rate), which represents a significant improvement over the state of the art. Finally, the combination of this classifier with the variables used by clinicians obtained a 91.3% accuracy (8.7% error rate). This is within the range of alternative, but costly and intrusive schemes, which unlike the one proposed can not be used in the preliminary assessment of patients’ condition. In the end, this Thesis has shed new light on the underlying connection between OSA and speech, and evidenced the degree of maturity reached by speech technology on OSA characterization and detection, leaving the door open for future research which shall continue in the multiple directions that have been pointed out and left as future work.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El objetivo de este Proyecto Fin de Carrera es el estudio y simulación de la sonorización de una sala de cine mediante la utilización del sistema DOLBY ATMOS. Para ello, se simulará la sala 6 del complejo de cines Kinépolis de Madrid utilizando el programa de simulación electroacústica EASE en el que se dispondrá el sistema de sonido DOLBY ATMOS. Primero se procederá a realizar el modelo geométrico en el programa EASE, a partir de los planos de la instalación y medidas realizadas en el recinto. Este programa de simulación permite obtener los parámetros acústicos y electroacústicos necesarios para realizar el estudio de la sala. Luego se diseñará el sistema de sonido de acuerdo a las disposiciones del sistema DOLBY ATMOS, mediante la ubicación de sistemas de altavoces de cine existentes en el mercado, siempre intentando mantener el uso de la sala de forma convencional como DOLBY DIGITAL y cumpliendo los requisitos de uniformidad y ángulos de apuntamiento recomendados por DOLBY. A continuación, una vez dispuestos los altavoces, se procederá a su configuración, realizando una ecualización y ajuste de nivel de manera individual para cada una de las fuentes sonoras, tanto de los altavoces de pantalla, altavoces de surround de pared y techo y los altavoces de subgraves. Como resultado de todo ello, se comprobarán parámetros como la inteligibilidad, respuesta impulsiva, respuesta en frecuencia y tiempo de reverberación en diferentes puntos de escucha, comparando los resultados obtenidos entre ellos. También se realizará una configuración compatible con el sistema de sonido 7.1, realizando su correspondiente configuración, ecualización, ajuste y aplicando los retardos necesarios. Una vez esté todo configurado, será dar un presupuesto de lo que supondría la reformar de un cine convencional a un sistema DOLBY ATMOS, teniendo en cuenta el número de altavoces disponibles en la sala actual, los modelos utilizados, amplificadores y mano de obra. También se realizará un diagrama de conexionado del sistema de sonido utilizado en el proyecto, incluyendo todos los parámetros necesarios de la configuración. Por último se comprobará la viabilidad técnica y económica del sistema diseñado, viendo cuál es la opción que más se adecua a cada necesidad y sugiriendo soluciones a los posibles problemas que se puedan encontrar. ABSTRACT. The main aim of this Project is the study and simulation of the sound of a movie theater by using DOLBY ATMOS system. It is going to be simulated the movie theatre 6 at Kinepolis cinema complex in Madrid using the simulation program EASE according to the sound system DOLBY ATMOS. First of all we proceed to conduct the geometric pattern in the EASE program, from installation drawings and measurements made on the premises. This simulation program allows getting the acoustic and electroacoustic parameters necessary for the study of the theatre. Then the sound system designed according to the suggestions of ATMOS DOLBY, by locating theater speaker systems on the market, always trying to keep the use of the room for DOLBY DIGITAL conventional and meeting the requirements of uniformity and pointing angles DOLBY recommended. Then, once the speakers are prepared, you can proceed to configure, make equalization and level setting individually for each of the sound sources, both screen speakers, surround speakers (wall and ceiling) and subwoofer. As a result, parameters are checked as intelligibility, impulse response, frequency response and reverberation time in different listening points, comparing the results between each other. There will also be configured to support 7.1 sound system, making the corresponding settings, equalization, level setting and applying the necessary delays. Once everything is configured, it will give an estimate of what would be the reform of a conventional film DOLBY ATMOS system, taking into account the number of speakers available in the current room, the models used, amplifiers and labor. Also there will be a wiring diagram of the sound system used in this project, including all of the configuration parameters needed. Finally, check the technical and economic feasibility of the designed system, seeing what is the option that best suits to each need and suggesting possible solutions to problems you might find during the process.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

We present an approach to adapt dynamically the language models (LMs) used by a speech recognizer that is part of a spoken dialogue system. We have developed a grammar generation strategy that automatically adapts the LMs using the semantic information that the user provides (represented as dialogue concepts), together with the information regarding the intentions of the speaker (inferred by the dialogue manager, and represented as dialogue goals). We carry out the adaptation as a linear interpolation between a background LM, and one or more of the LMs associated to the dialogue elements (concepts or goals) addressed by the user. The interpolation weights between those models are automatically estimated on each dialogue turn, using measures such as the posterior probabilities of concepts and goals, estimated as part of the inference procedure to determine the actions to be carried out. We propose two approaches to handle the LMs related to concepts and goals. Whereas in the first one we estimate a LM for each one of them, in the second one we apply several clustering strategies to group together those elements that share some common properties, and estimate a LM for each cluster. Our evaluation shows how the system can estimate a dynamic model adapted to each dialogue turn, which helps to improve the performance of the speech recognition (up to a 14.82% of relative improvement), which leads to an improvement in both the language understanding and the dialogue management tasks.