1000 resultados para Procesamiento digital de voz
Resumo:
En dispositivos electrónicos de última generación destinados a funciones de comunicación o control automático, los algoritmos de procesamiento digital de señales trasladados al hardware han ocupado un lugar fundamental. Es decir el estado de arte en el área de las comunicaciones y control puede resumirse en algoritmos basados en procesamiento digital de señales. Las implementaciones digitales de estos algoritmos han sido estudiadas en áreas de la informática desde hace tiempo. Sin embargo, aunque el incremento en la complejidad de los algoritmos modernos permite alcanzar desempeños atractivos en aplicaciones específicas, a su vez impone restricciones en la velocidad de operación que han motivado el diseño directamente en hardware de arquitecturas para alto rendimiento. En este contexto, los circuitos electrónicos basados en lógica programable, principalmente los basados en FPGA (Field-Programmable Gate Array), permiten obtener medidas de desempeño altamente confiables que proporcionan el acercamiento necesario hacia el diseño electrónico de circuitos para aplicaciones específicas “ASIC-VLSI” (Application Specific Integrated Circuit - Very Large Scale Integration). En este proyecto se analiza el diseño y la implementación de aquitecturas electrónicas para el procesamiento digital de señales, con el objeto de obtener medidas reales sobre el comportamiento del canal inalámbrico y su influencia sobre la estimación y el control de trayectoria en vehículos aéreos no tripulados (UAV, Unmanned Aerial Vehicle). Para esto se propone analizar un dispositivo híbrido basado en microcontroladores y circuitos FPGA y sobre este mismo dispositivo implementar mediante algoritmo un control de trayectoria que permita mantener un punto fijo en el centro del cuadro de una cámara de video a bordo de un UAV, que sea eficiente en términos de velocidad de operación, dimensiones y consumo de energía.
Resumo:
We propose a study of the mathematical properties of voice as an audio signal -- This work includes signals in which the channel conditions are not ideal for emotion recognition -- Multiresolution analysis- discrete wavelet transform – was performed through the use of Daubechies Wavelet Family (Db1-Haar, Db6, Db8, Db10) allowing the decomposition of the initial audio signal into sets of coefficients on which a set of features was extracted and analyzed statistically in order to differentiate emotional states -- ANNs proved to be a system that allows an appropriate classification of such states -- This study shows that the extracted features using wavelet decomposition are enough to analyze and extract emotional content in audio signals presenting a high accuracy rate in classification of emotional states without the need to use other kinds of classical frequency-time features -- Accordingly, this paper seeks to characterize mathematically the six basic emotions in humans: boredom, disgust, happiness, anxiety, anger and sadness, also included the neutrality, for a total of seven states to identify
Resumo:
We propose a novel analysis alternative, based on two Fourier Transforms for emotion recognition from speech -- Fourier analysis allows for display and synthesizes different signals, in terms of power spectral density distributions -- A spectrogram of the voice signal is obtained performing a short time Fourier Transform with Gaussian windows, this spectrogram portraits frequency related features, such as vocal tract resonances and quasi-periodic excitations during voiced sounds -- Emotions induce such characteristics in speech, which become apparent in spectrogram time-frequency distributions -- Later, the signal time-frequency representation from spectrogram is considered an image, and processed through a 2-dimensional Fourier Transform in order to perform the spatial Fourier analysis from it -- Finally features related with emotions in voiced speech are extracted and presented
Resumo:
Los retos en las actividades de innovación en docencia, se basan en la necesidad de proponer nuevos métodos y estrategias que permitan ampliar y armonizar toda clase de recursos que se tengan disponibles, para potencializar los resultados en el proceso de enseñanza - aprendizaje -- En el caso de la asignatura de rocas metamórficas, es muy común identificar dificultades en los estudiantes en el análisis petrográfico, identificación de minerales, patrones texturales, y relación con curvas de blastesis; por lo anterior se quiso implementar el tratamiento de análisis digital de imágenes (ADI), como una herramienta pedagógica que facilite el aprendizaje de los mismos
Resumo:
Digital rock physics combines modern imaging with advanced numerical simulations to analyze the physical properties of rocks -- In this paper we suggest a special segmentation procedure which is applied to a carbonate rock from Switzerland -- Starting point is a CTscan of a specimen of Hauptmuschelkalk -- The first step applied to the raw image data is a nonlocal mean filter -- We then apply different thresholds to identify pores and solid phases -- Because we are aware of a nonneglectable amount of unresolved microporosity we also define intermediate phases -- Based on this segmentation determine porositydependent values for the pwave velocity and for the permeability -- The porosity measured in the laboratory is then used to compare our numerical data with experimental data -- We observe a good agreement -- Future work includes an analytic validation to the numerical results of the pwave velocity upper bound, employing different filters for the image segmentation and using data with higher resolution
Resumo:
El crecimiento exponencial del tráfico de datos es uno de los mayores desafíos que enfrentan actualmente los sistemas de comunicaciones, debiendo los mismos ser capaces de soportar velocidades de procesamiento de datos cada vez mas altas. En particular, el consumo de potencia se ha transformado en uno de los parámetros de diseño más críticos, generando la necesidad de investigar el uso de nuevas arquitecturas y algoritmos para el procesamiento digital de la información. Por otro lado, el análisis y evaluación de nuevas técnicas de procesamiento presenta dificultades dadas las altas velocidades a las que deben operar, resultando frecuentemente ineficiente el uso de la simulación basada en software como método. En este contexto, el uso de electrónica programable ofrece una oportunidad a bajo costo donde no solo se evaluan nuevas técnicas de diseño de alta velocidad sino también se valida su implementación en desarrollos tecnológicos. El presente proyecto tiene como objetivo principal el estudio y desarrollo de nuevas arquitecturas y algoritmos en electrónica programable para el procesamiento de datos a alta velocidad. El método a utilizar será la programación en dispositivos FPGA (Field-Programmable Gate Array) que ofrecen una buena relación costo-beneficio y gran flexibilidad para integrarse con otros dispositivos de comunicaciones. Para la etapas de diseño, simulación y programación se utilizaran herramientas CAD (Computer-Aided Design) orientadas a sistemas electrónicos digitales. El proyecto beneficiara a estudiantes de grado y postgrado de carreras afines a la informática y las telecomunicaciones, contribuyendo al desarrollo de proyectos finales y tesis doctorales. Los resultados del proyecto serán publicados en conferencias y/o revistas nacionales e internacionales y divulgados a través de charlas de difusión y/o encuentros. El proyecto se enmarca dentro de un área de gran importancia para la Provincia de Córdoba, como lo es la informática y las telecomunicaciones, y promete generar conocimiento de gran valor agregado que pueda ser transferido a empresas tecnológicas de la Provincia de Córdoba a través de consultorias o desarrollos de productos.
Resumo:
L'objectiu d'aquest TFC és implementar un sistema senzill de protecció del copyright per a imatges de format BMP mitjançant un esquema de marcatge basat en codis duals de Hamming, que permeten recuperar la marca quan la imatge marcada ha estat sotmesa a certs tipus de processament digital i també en el cas de confabulació de dos compradors.
Resumo:
The question of participation has been debated in Brazil since the 1980 decade in search a better way to take care of poulation s demand. More specificaly after the democratic open (1985) begins to be thought ways to make population participates of decisions related to alocation of public resources. The characteristic of participates actualy doesn t exist, population to be carried through is, at top, consulted, and the fact population participates stays restrict to some technics interests at the projects, mainly of public politics of local development. Observe that this implementation happens through a process and that has its limits (pass) that could be surpassed through strategies made to that. This dissertation shows results of a research about participative practices in city of Serrinha between 1997 and 2004, showing through a study of the case of Serrinha what was the process used to carry through these pratices in a moment and local considered model of this application. The analyses were developed through a model of research elaborated by the author based on large literature respects the ideal process to implant a participative public politics. The present research had a qualitative boarding, being explorative and descritive nature. The researcher (author of this dissertation) carried through all the research phases, including the transcriptions of interviews that were recorded with a digital voice recorder. Before the analysis of these data was verified that despite the public manager (former-mayor) had had a real interest in implant a process of local development in city, he was not able to forsee the correct process to do it. Two high faults were made. The first was the intention to have as tool a development plan, what locked up to make this plan was the booster of supossed participative pratice and no the ideal model that would be a plan generate by popular initiative. The second one was absence of a critical education project for the population that should be the fisrt step to carry through a politc like that
Resumo:
[ES] IPOL es una revista científica de procesamiento digital de imágenes y diversos métodos de análisis de imágenes. En cada publicación se incorpora una demo donde cualquier persona puede probar, vía web, el funcionamiento del método descrito en dicha publicación. De esta forma, se puede usar el método sin tener conocimiento de programación ni tener que instalarlo en su ordenador. En este proyecto fin de carrera se quiere desarrollar una aplicación que permita la ejecución de las demos desde un dispositivo móvil. Con ello, se pretende hacer más accesible la ejecución de algoritmo de procesamiento de imágenes y aumentar su divulgación científica.
Resumo:
Las nuevas tecnologías y el procesamiento digital han facilitado considerablemente la lingüística de corpus, por ejemplo Internet es una herramienta fácil y barata para recopilar corpus. Internet es cada vez más popular y más importante para la comunicación a causa de la enorme influencia de los nuevos medios y ha afectado la vida y la sociedad de muchas maneras y en parte, de manera fundamental. No sorprende por eso que la lengua y la comunicación misma se vean afectadas. Uno de los fenómenos más interesantes dentro de la comunicación mediada por ordenadores (CMC) son las redes sociales en línea, que en pocos años se han convertido en un medio de comunicación muy difundido y en expansión continua. Su estudio es particularmente interesante porque debido al desarrollo constante de la tecnología las redes sociales en línea no son una entidad estática, sino que cambian incesantemente, introduciéndose frecuentemente novedades para su uso. Estas novedades están condicionadas por el medio electrónico que a su vez influye decisivamente en el estilo de comunicación empleado en redes sociales como Facebook y Tuenti. Al ser un nuevo medio de interacción social, las redes sociales en línea producen un estilo de comunicación propio. El objetivo de análisis de mi tesis es cómo los usuarios de Facebook y Tuenti de la ciudad de Málaga crean este estilo mediante el uso de rasgos fónicos propios de la variedad andaluza y de qué manera la actitud lingüística de los usuarios influye en el uso de dichos rasgos fónicos. Este estudio se basa en un corpus elaborado a partir de enunciados de informantes en Facebook y Tuenti. Un corpus constituido por transcripciones amplias de grabaciones de hablantes malagueños me sirve de corpus de comparación. Otra herramienta metodológica empleada para recopilar datos será la encuesta: un tipo de encuesta estará destinada a captar las actitudes de los participantes frente a diversos rasgos del habla andaluza/malagueña y otro a examinar por qué la gente utiliza estos rasgos en Facebook y Tuenti. Este estudio se apoya en los resultados de un estudio piloto que muestran que los factores sociales y lingüísticos analizados funcionan de manera distinta en el habla real y virtual. Debido a estos usos diferentes podemos considerar la comunicación electrónica de Facebook y Tuenti como un estilo condicionado por el tipo de espacio virtual. Se trata de un estilo que sirve a los usuarios para crear significado social y para expresar sus identidades a partir de la lengua.
Resumo:
La metodología del número de la curva (NC) es la más empleada para transformar la precipitación total en precipitación efectiva. De esta manera se constituye en una herramienta de gran valor para realizar estudios hidrológicos en cuencas hidrográficas, fundamentalmente cuando hay una deficiencia de registros extensos y confiables. Esta metodología requiere del conocimiento del tipo y uso de suelo de la cuenca en estudio y registros pluviográficos. En el presente trabajo se aplicó el procesamiento de imágenes LANDSAT para la zonificación de la vegetación y uso del suelo en la cuenca del Arroyo Pillahuinco Grande (38° LS y 61° 15' LW), ubicada sobre el sistema serrano de La Ventana, en el sudoeste de la provincia de Buenos Aires, Argentina. El análisis de su interrelación generó los valores de NC y coeficiente de escorrentía (CE). El procesamiento digital de la base de datos raster georreferenciada se realizó con aplicación de herramientas de sistema de información geográfica (Idrisi Kilimanjaro). El análisis de regresión múltiple efectuado a las variables generó un R2 que explica el 89,77 % de la variabilidad de CE (a < 0,01). Los resultados se exponen a nivel diagnóstico y zonificación del NC, donde la mayor influencia de la escorrentía se relaciona con las variables cobertura vegetal y uso del suelo.
Resumo:
El riego es una construcción social. Esto no ha sido tenido suficientemente en cuenta en la gestión de áreas con riesgo recurrente de excesos o déficit hídricos. Por otra parte, la vulnerabilidad social se define por las condiciones sociales, económicas, culturales e institucionales de una sociedad, previas a la ocurrencia de un evento catastrófico que la predispone para sufrir o evitar daños. Las consecuencias que dejó el temporal ocurrido el 2 de abril de 2013 cuando precipitaron sobre el área de la Ciudad de La Plata y sus alrededores aproximadamente unos 400 mm de los cuales 313 mm lo hicieron en tan sólo seis horas se cobró 60 vidas (cifra oficialmente reconocida por las autoridades), 357.500 ciudadanos damnificados, lo que equivale a más del 55 por ciento del total de la población del partido de La Plata y 2.600 millones de pesos en pérdidas materiales. Este fenómeno supone la presentación de alternativas de manejo del riesgo hídrico que tenga en cuenta las condiciones de recurrencia de las inundaciones e identificar los grupos sociales con algún nivel de necesidades básicas insatisfechas que se encuentran vulnerables a la recurrencia de estos eventos. Para ello, se propone una metodología capaz de alertar a los actores involucrados sobre el estado de criticidad de las áreas identificadas como más vulnerables mediante la utilización de los Sistemas de Información Geográfica (SIG) que posibilitan integrar la información estadística a nivel de radio censal proveniente del Censo Nacional de Población, Hogares y Viviendas 2010 con productos provenientes del procesamiento digital de imágenes satelitales
Resumo:
El riego es una construcción social. Esto no ha sido tenido suficientemente en cuenta en la gestión de áreas con riesgo recurrente de excesos o déficit hídricos. Por otra parte, la vulnerabilidad social se define por las condiciones sociales, económicas, culturales e institucionales de una sociedad, previas a la ocurrencia de un evento catastrófico que la predispone para sufrir o evitar daños. Las consecuencias que dejó el temporal ocurrido el 2 de abril de 2013 cuando precipitaron sobre el área de la Ciudad de La Plata y sus alrededores aproximadamente unos 400 mm de los cuales 313 mm lo hicieron en tan sólo seis horas se cobró 60 vidas (cifra oficialmente reconocida por las autoridades), 357.500 ciudadanos damnificados, lo que equivale a más del 55 por ciento del total de la población del partido de La Plata y 2.600 millones de pesos en pérdidas materiales. Este fenómeno supone la presentación de alternativas de manejo del riesgo hídrico que tenga en cuenta las condiciones de recurrencia de las inundaciones e identificar los grupos sociales con algún nivel de necesidades básicas insatisfechas que se encuentran vulnerables a la recurrencia de estos eventos. Para ello, se propone una metodología capaz de alertar a los actores involucrados sobre el estado de criticidad de las áreas identificadas como más vulnerables mediante la utilización de los Sistemas de Información Geográfica (SIG) que posibilitan integrar la información estadística a nivel de radio censal proveniente del Censo Nacional de Población, Hogares y Viviendas 2010 con productos provenientes del procesamiento digital de imágenes satelitales
Resumo:
El riego es una construcción social. Esto no ha sido tenido suficientemente en cuenta en la gestión de áreas con riesgo recurrente de excesos o déficit hídricos. Por otra parte, la vulnerabilidad social se define por las condiciones sociales, económicas, culturales e institucionales de una sociedad, previas a la ocurrencia de un evento catastrófico que la predispone para sufrir o evitar daños. Las consecuencias que dejó el temporal ocurrido el 2 de abril de 2013 cuando precipitaron sobre el área de la Ciudad de La Plata y sus alrededores aproximadamente unos 400 mm de los cuales 313 mm lo hicieron en tan sólo seis horas se cobró 60 vidas (cifra oficialmente reconocida por las autoridades), 357.500 ciudadanos damnificados, lo que equivale a más del 55 por ciento del total de la población del partido de La Plata y 2.600 millones de pesos en pérdidas materiales. Este fenómeno supone la presentación de alternativas de manejo del riesgo hídrico que tenga en cuenta las condiciones de recurrencia de las inundaciones e identificar los grupos sociales con algún nivel de necesidades básicas insatisfechas que se encuentran vulnerables a la recurrencia de estos eventos. Para ello, se propone una metodología capaz de alertar a los actores involucrados sobre el estado de criticidad de las áreas identificadas como más vulnerables mediante la utilización de los Sistemas de Información Geográfica (SIG) que posibilitan integrar la información estadística a nivel de radio censal proveniente del Censo Nacional de Población, Hogares y Viviendas 2010 con productos provenientes del procesamiento digital de imágenes satelitales
Resumo:
Este proyecto tiene como objetivo el desarrollo de una interfaz MIDI, basada en técnicas de procesamiento digital de la imagen, capaz de controlar diversos parámetros de un software de audio mediante información gestual: el movimiento de las manos. La imagen es capturada por una cámara Kinect comercial y los datos obtenidos por ésta son procesados en tiempo real. La finalidad es convertir la posición de varios puntos de control de nuestro cuerpo en información de control musical MIDI. La interfaz ha sido desarrollada en el lenguaje y entorno de programación Processing, el cual está basado en Java, es de libre distribución y de fácil utilización. El software de audio seleccionado es Ableton Live, versión 8.2.2, elegido porque es útil tanto para la composición musical como para la música en directo, y esto último es la principal utilidad que se le pretende dar a la interfaz. El desarrollo del proyecto se divide en dos bloques principales: el primero, diseño gráfico del controlador, y el segundo, la gestión de la información musical. En el primer apartado se justifica el diseño del controlador, formado por botones virtuales: se explica el funcionamiento y, brevemente, la función de cada botón. Este último tema es tratado en profundidad en el Anexo II: Manual de usuario. En el segundo bloque se explica el camino que realiza la información MIDI desde el procesador gestual hasta el sintetizador musical. Este camino empieza en Processing, desde donde se mandan los mensajes que más tarde son interpretados por el secuenciador seleccionado, Ableton Live. Una vez terminada la explicación con detalle del desarrollo del proyecto se exponen las conclusiones del autor acerca del desarrollo del proyecto, donde se encuentran los pros y los contras a tener en cuenta para poder sacar el máximo provecho en el uso del controlador . En este mismo bloque de la memoria se exponen posibles líneas futuras a desarrollar. Se facilita también un presupuesto, desglosado en costes materiales y de personal. ABSTRACT. The aim of this project is the development of a MIDI interface based on image digital processing techniques, able to control several parameters of an audio software using gestural information, the movement of the hands. The image is captured by a commercial Kinect camera and the data obtained by it are processed in real time. The purpose is to convert the position of various points of our body into MIDI musical control information. The interface has been developed in the Processing programming language and environment which is based on Java, freely available and easy to used. The audio software selected is Ableton Live, version 8.2.2, chosen because it is useful for both music composition and live music, and the latter is the interface main intended utility. The project development is divided into two main blocks: the controller graphic design, and the information management. The first section justifies the controller design, consisting of virtual buttons: it is explained the operation and, briefly, the function of each button. This latter topic is covered in detail in Annex II: user manual. In the second section it is explained the way that the MIDI information makes from the gestural processor to the musical synthesizer. It begins in Processing, from where the messages, that are later interpreted by the selected sequencer, Ableton Live, are sent. Once finished the detailed explanation of the project development, the author conclusions are presented, among which are found the pros and cons to take into account in order to take full advantage in the controller use. In this same block are explained the possible future aspects to develop. It is also provided a budget, broken down into material and personal costs.