904 resultados para audio-visual automatic speech recognition
Resumo:
But: La perte unilatérale du cortex visuel postérieur engendre une cécité corticale controlatérale à la lésion, qu’on appelle hémianopsie homonyme (HH). Celle-ci est notamment accompagnée de problèmes d’exploration visuelle dans l’hémichamp aveugle dus à des stratégies oculaires déficitaires, qui ont été la cible des thérapies de compensation. Or, cette perte de vision peut s’accompagner d’une perception visuelle inconsciente, appelée blindsight. Notre hypothèse propose que le blindsight soit médié par la voie rétino-colliculaire extrastriée, recrutant le colliculus supérieur (CS), une structure multisensorielle. Notre programme a pour objectif d’évaluer l’impact d’un entraînement multisensoriel (audiovisuel) sur la performance visuelle inconsciente des personnes hémianopsiques et les stratégies oculaires. Nous essayons, ainsi, de démontrer l’implication du CS dans le phénomène de blindsight et la pertinence de la technique de compensation multisensorielle comme thérapie de réadaptation. Méthode: Notre participante, ML, atteinte d’une HH droite a effectué un entraînement d’intégration audiovisuel pour une période de 10 jours. Nous avons évalué la performance visuelle en localisation et en détection ainsi que les stratégies oculaires selon trois comparaisons principales : (1) entre l’hémichamp normal et l’hémichamp aveugle; (2) entre la condition visuelle et les conditions audiovisuelles; (3) entre les sessions de pré-entraînement, post-entraînement et 3 mois post-entraînement. Résultats: Nous avons démontré que (1) les caractéristiques des saccades et des fixations sont déficitaires dans l’hémichamp aveugle; (2) les stratégies saccadiques diffèrent selon les excentricités et les conditions de stimulations; (3) une adaptation saccadique à long terme est possible dans l’hémichamp aveugle si l’on considère le bon cadre de référence; (4) l’amélioration des mouvements oculaires est liée au blindsight. Conclusion(s): L’entraînement multisensoriel conduit à une amélioration de la performance visuelle pour des cibles non perçues, tant en localisation qu’en détection, ce qui est possiblement induit par le développement de la performance oculomotrice.
Resumo:
Speech signals are one of the most important means of communication among the human beings. In this paper, a comparative study of two feature extraction techniques are carried out for recognizing speaker independent spoken isolated words. First one is a hybrid approach with Linear Predictive Coding (LPC) and Artificial Neural Networks (ANN) and the second method uses a combination of Wavelet Packet Decomposition (WPD) and Artificial Neural Networks. Voice signals are sampled directly from the microphone and then they are processed using these two techniques for extracting the features. Words from Malayalam, one of the four major Dravidian languages of southern India are chosen for recognition. Training, testing and pattern recognition are performed using Artificial Neural Networks. Back propagation method is used to train the ANN. The proposed method is implemented for 50 speakers uttering 20 isolated words each. Both the methods produce good recognition accuracy. But Wavelet Packet Decomposition is found to be more suitable for recognizing speech because of its multi-resolution characteristics and efficient time frequency localizations
Resumo:
Speech is a natural mode of communication for people and speech recognition is an intensive area of research due to its versatile applications. This paper presents a comparative study of various feature extraction methods based on wavelets for recognizing isolated spoken words. Isolated words from Malayalam, one of the four major Dravidian languages of southern India are chosen for recognition. This work includes two speech recognition methods. First one is a hybrid approach with Discrete Wavelet Transforms and Artificial Neural Networks and the second method uses a combination of Wavelet Packet Decomposition and Artificial Neural Networks. Features are extracted by using Discrete Wavelet Transforms (DWT) and Wavelet Packet Decomposition (WPD). Training, testing and pattern recognition are performed using Artificial Neural Networks (ANN). The proposed method is implemented for 50 speakers uttering 20 isolated words each. The experimental results obtained show the efficiency of these techniques in recognizing speech
Resumo:
Malayalam is one of the 22 scheduled languages in India with more than 130 million speakers. This paper presents a report on the development of a speaker independent, continuous transcription system for Malayalam. The system employs Hidden Markov Model (HMM) for acoustic modeling and Mel Frequency Cepstral Coefficient (MFCC) for feature extraction. It is trained with 21 male and female speakers in the age group ranging from 20 to 40 years. The system obtained a word recognition accuracy of 87.4% and a sentence recognition accuracy of 84%, when tested with a set of continuous speech data.
Resumo:
The planning and organization of audio-visual instruction media are placed within a communication theoretical reference frame which begins where audio-visual media cease to function for daily instruction. Media-bound disorders however, are only seen as the surface conflict between opposing communication paradigms. The decisive task of the teacher is to remove audio-visual media from a communication context which is contradictory to instruction. This is successful when the objectification performance of audio-visual media is used to serve the subjective process of cognition. As order to support the teacher in this complex task of planning, a taxonomy is presented which operationalizes the essential problems when using media.
Resumo:
Zur Erholung in die Natur gehen oder doch lieber zur Natursimulation greifen? Intuitiv würden die meisten Menschen der Natur einen größeren Erholungswert zusprechen als einer Natursimulation. Aber ist die Natur tatsächlich erholsamer? In der Naturerholungsforschung (Restorative Environment Research) kommen häufig Natursimulationen zum Einsatz, um die erholsame Wirkung von Natur zu ermitteln. Problematisch ist dabei, dass deren ökologische Validität und Vergleichbarkeit noch nicht empirisch abgesichert ist. Vorliegende Arbeit setzt an dieser methodischen und empirischen Lücke an. Sie überprüft sowohl die ökologische Validität als auch die Vergleichbarkeit von Natursimulationen. Dazu wird die erholsame Wirkung von zwei Natursimulationen im Vergleich zu der physisch-materiellen Natur empirisch untersucht und verglichen. Darüber hinaus werden Aspekte des subjektiven Erlebens und der Bewertung im Naturerholungskontext exploriert. Als bedeutsamer Wirkmechanismus wird die erlebnisbezogene Künstlichkeit/Natürlichkeit angesehen, die sich auf die Erlebnisqualität von Natursimulationen und der physisch-materiellen Natur bezieht: Natursimulationen weisen im Vergleich zur physisch-materiellen Natur eine reduzierte Erlebnisqualität auf (erlebnisbezogene Künstlichkeit), z.B. eine reduzierte Qualität und Quantität der Sinnesansprache. Stellt man einen derartigen Vergleich nicht nur mit der physisch-materiellen Natur, sondern mit unterschiedlichen Natursimulationstypen an, dann zeigen sich auch hier Unterschiede in der erlebnisbezogenen Künstlichkeit. Beispielsweise unterscheidet sich ein Naturfoto von einem Naturfilm durch das Fehlen von auditiven und bewegten Stimuli. Diese erlebnisbezogene Künstlichkeit kann die erholsame Wirkung von Natur - direkt oder indirekt über Bewertungen - hemmen. Als Haupthypothese wird angenommen, dass mit zunehmendem Ausmaß an erlebnisbezogener Künstlichkeit die erholsame Wirkung der Natur abnimmt. Dem kombinierten Feld- und Laborexperiment liegt ein einfaktorielles Vorher-Nachher-Design zugrunde. Den 117 Probanden wurde zunächst eine kognitiv und affektiv belastende Aufgabe vorgelegt, danach folgte die Erholungsphase. Diese bestand aus einem Spaziergang, der entweder in der physisch-materiellen Natur (urbaner Park) oder in einer der beiden audio-visuellen Natursimulationen (videogefilmter vs. computergenerierter Spaziergang durch selbigen urbanen Park) oder auf dem Laufband ohne audio-visuelle Darbietung stattfand. Die erlebnisbezogene Künstlichkeit/Natürlichkeit wurde also wie folgt operationlisiert: die physische Natur steht für die erlebnisbezogene Natürlichkeit. Die beiden Natursimulationen stehen für die erlebnisbezogene Künstlichkeit. Die computergenerierte Version ist im Vergleich zur Videoversion erlebnisbezogen künstlicher, da sie weniger fotorealistisch ist. Die Zuordnung zu einer der vier experimentellen Erholungssettings erfolgte nach dem Zufallsprinzip. Die Effekte von moderater Bewegung wurden in den Natursimulationen durch das Laufen auf dem Laufband kontrolliert. Die Beanspruchungs- bzw. Erholungsreaktionen wurden auf kognitiver (Konzentriertheit, Aufmerksamkeitsleistung) affektiver (3 Befindlichkeitsskalen: Wachheit, Ruhe, gute Stimmung) und physiologischer (Alpha-Amylase) Ebene gemessen, um ein umfassendes Bild der Reaktionen zu erhalten. Insgesamt zeigen die Ergebnisse, dass die beiden Natursimulationen trotz Unterschiede in der erlebnisbezogenen Künstlichkeit/Natürlichkeit zu relativ ähnlichen Erholungsreaktionen führen, wie die physisch-materielle Natur. Eine Ausnahme stellen eine der drei affektiven (Wachheit) und die physiologische Reaktion dar: Probanden der physisch-materiellen Naturbedingung geben an wacher zu sein und weisen - wider erwarten - eine höhere physiologische Erregung auf. Demnach ist die physisch-materielle Natur nicht grundsätzlich erholsamer als die Natursimulationen. Die Hypothese ließ sich somit nicht bestätigen. Vielmehr deuten sich komplexe Erholungsmuster und damit auch unterschiedliche Erholungsqualitäten der Settings an, die einer differenzierten Betrachtung bedürfen. Für die ökologische Validität von Natursimulationen gilt, dass diese nur mit Einschränkung als ökologisch valide bezeichnet werden können, d.h. nur für bestimmte, aber nicht für alle Erholungsreaktionen. Die beiden Natursimulationen führen ebenfalls trotz Unterschiede in der erlebnisbezogenen Künstlichkeit zu ähnlichen Erholungsreaktionen und können somit als gleichwertig behandelt werden. Erstaunlicherweise kommt es hier zu ähnlichen Erholungsreaktionen, obwohl die bestehenden Unterschiede von den Probanden wahrgenommen und die erlebnisbezogen künstlichere computergenerierte Version negativer bewertet wird. Aufgrund der nicht erwartungskonformen Ergebnisse muss das Erklärungskonzept der erlebnisbezogenen Künstlichkeit/Natürlichkeit infrage gestellt werden. Alternative Erklärungskonzepte für die Ergebnisse („Ungewissheit“, mentale räumliche Modelle), die sich andeutenden unterschiedlichen Erholungsqualitäten der Settings, methodische Einschränkungen sowie die praktische Bedeutung der Ergebnisse werden kritisch diskutiert.
Resumo:
As AI has begun to reach out beyond its symbolic, objectivist roots into the embodied, experientialist realm, many projects are exploring different aspects of creating machines which interact with and respond to the world as humans do. Techniques for visual processing, object recognition, emotional response, gesture production and recognition, etc., are necessary components of a complete humanoid robot. However, most projects invariably concentrate on developing a few of these individual components, neglecting the issue of how all of these pieces would eventually fit together. The focus of the work in this dissertation is on creating a framework into which such specific competencies can be embedded, in a way that they can interact with each other and build layers of new functionality. To be of any practical value, such a framework must satisfy the real-world constraints of functioning in real-time with noisy sensors and actuators. The humanoid robot Cog provides an unapologetically adequate platform from which to take on such a challenge. This work makes three contributions to embodied AI. First, it offers a general-purpose architecture for developing behavior-based systems distributed over networks of PC's. Second, it provides a motor-control system that simulates several biological features which impact the development of motor behavior. Third, it develops a framework for a system which enables a robot to learn new behaviors via interacting with itself and the outside world. A few basic functional modules are built into this framework, enough to demonstrate the robot learning some very simple behaviors taught by a human trainer. A primary motivation for this project is the notion that it is practically impossible to build an "intelligent" machine unless it is designed partly to build itself. This work is a proof-of-concept of such an approach to integrating multiple perceptual and motor systems into a complete learning agent.
Resumo:
Graphical techniques for modeling the dependencies of randomvariables have been explored in a variety of different areas includingstatistics, statistical physics, artificial intelligence, speech recognition, image processing, and genetics.Formalisms for manipulating these models have been developedrelatively independently in these research communities. In this paper weexplore hidden Markov models (HMMs) and related structures within the general framework of probabilistic independencenetworks (PINs). The paper contains a self-contained review of the basic principles of PINs.It is shown that the well-known forward-backward (F-B) and Viterbialgorithms for HMMs are special cases of more general inference algorithms forarbitrary PINs. Furthermore, the existence of inference and estimationalgorithms for more general graphical models provides a set of analysistools for HMM practitioners who wish to explore a richer class of HMMstructures.Examples of relatively complex models to handle sensorfusion and coarticulationin speech recognitionare introduced and treated within the graphical model framework toillustrate the advantages of the general approach.
Resumo:
Este es un estudio de investigación cualitativo, exploratorio, con metodología de estudio de caso en el que se indaga sobre las características y la dinámica del poder manifiesta en la relación de una pareja en separación y que se somete a un proceso de mediación desde un modelo relacional simbólico.Estos aspectos se determinaron a partir de la observación que se realizó a la pareja durante el proceso de mediación, por medio de registros audio-visuales, el desarrollo del genograma familiar y las entrevistas a profundidad durante el proceso; se obtuvieron los siguientes resultados de los enunciados verbales y de las expresiones gestuales del hombre y de la mujer: El aspecto de poder que se presenta en la pareja con mayor énfasis tiene relación con los hijos, el hombre retiene físicamente a los hijos lo que le otorga un manejo de poder en torno a ella y la mujer se aleja de ellos para evitar confrontaciones con su ex compañero. Un segundo aspecto de poder que se manifiesta tanto en el hombre como en la mujer es el relacionado con los rasgos personales, se identifica un carácter manipulador. En él se evidencia por el manejo inadecuado de la relación de los hijos con la madre y en ella se hace visible a través de la invención de situaciones o mentiras para justificar sus vacíos. En la dinámica de poder evidenciada en la pareja objeto de esta investigación el poder se manifiesta en todo argumento defensivo, en las justificaciones, recriminaciones, en la percepción, en la desconfianza y el imaginario negativo que se tiene del otro, tornándose así en un poder preconcebido como absoluto y despótico por parte de los dos miembros de la pareja, estos aspectos de poder identificados se constituyen en verdaderos obstáculos para el negociar de la pareja, limitando la posibilidad de intercambio y entendimiento necesarios para la culminación de la mediación. Es de anotar que el presente proyecto presenta la clasificación de riesgo mínimo, según la Resolución 8430 de 1993.
Resumo:
Diana Turbay, historia de un secuestro, es un reportaje audiovisual que pretende traer a la memoria uno de los tantos hechos que el más recordado narcotraficante de Colombia, Pablo Escobar Gaviria, cometió para lograr sus objetivos. La utilización del secuestro como forma de presionar a todo un gobierno para evitar la expedición de una norma.
Resumo:
Una preocupación por el valor formativo de las imágenes que nos circundan y la laguna al respecto que muestra la educación formal española nos puso en marcha para realizar una investigación doctoral. Así que nos propusimos: 1. Estudiar la relación entre dos ámbitos que se ocupan del estudio y la producción de imágenes: la Educación Artística y la Educación Mediática. Mediante un análisis pormenorizado de las investigaciones y experiencias más relevantes que nos permitieron evidenciar el papel que los medios juegan en la Educación Artística y el que las artes juegan en la Educación Mediática. Indagar en el modo en el que la Educación Artística (en adelante E.A.) pudiera incidir en la Mediática (en adelante E.M.) mediante una prueba experimental, en un entorno educativo eal, con el fin de desarrollar la comprensión crítica de los estudiantes
Resumo:
List of references in Harvard format for the accessibility text tutorial created by Denis's Angels.
Resumo:
Con este trabajo se pretende demostrar que la enseñanza de la lengua oral debe hacerse en situación y que para crear dicha situación son necesarios los distintos medios audio-visuales. Dado que el medio audio-visual consta de dos elementos, el visual y el sonoro, en este trabajo se estudia individualmente cada uno de ellos, así como las condiciones que deben cumplir para poder ser utilizados en la enseñanza y los distintos tipos de material empleados por los métodos más conocidos. Por fin, se agrupan los distintos medios audio-visuales que existen. Los medios audio-visuales han tenido un desarrollo fulgurante. Hace 25 ó 30 años los únicos medios con que contaba el profesor eran los carteles y dibujos. La aparición de los medios de grabación y reproducción del sonido y las nuevas técnicas gráficas han supuesto un impulso enorme en la propagación de dichos medios. Es interesante observar dos tendencias que tienen los distintos medios que van apareciendo. Por una parte, todos ellos tienden a facilitar la labor del profesor (más que a facilitar la labor del profesor, tienden a aumentar el rendimiento). La segunda tendencia que se observa es que facilitan la autoinstrucción, ya que es la única posibilidad de millones de personas en todo el mundo de aprender una segunda lengua. Se observa, asimismo, una tendencia a combinar los elementos oral y visual en lo que se han llamado medios y métodos audio-visuales. Las colecciones de medios orales o visuales exclusivamente van siendo cada vez menos frecuentes.
Resumo:
La voz como herramienta de trabajo de los docentes, puede afectarse por su uso prolongado, abuso o conductas de mal uso, que desencadenan limitaciones funcionales de origen laboral. Uno de los síntomas más frecuentes de quienes usan masivamente su voz con fines ocupacionales es la fatiga laríngea (FL), o cansancio vocal por debilitamiento muscular. El presente estudio quasiexperimental longitudinal pre- postest evaluó el efecto que el uso de la voz, analizando variables sociodemográficas, de salud y trabajo, los estilos de vida y los factores de riesgo ocupacionales, pero principalmente el efecto que produce el uso prolongado de la voz sobre las variables físico acústicas después de un día de trabajo, en 99 docentes de una institución de educación superior en Colombia, en comparación con trabajadores con menor uso vocal. Se aplicó un cuestionario de sintomatología vocal para controlar los sesgos, se le tomaron grabaciones pre y post jornada a cada trabajador con el software Speech Analizer® y se reportaron los cambios subjetivos tras un día de trabajo a cada trabajador. Fueron hallados cambios en las variables físico – acústicas como efecto del uso prolongado de la voz después de un día de trabajo en los dos grupos de participantes, en cuyo caso el efecto fue más significativo en los docentes que en los administrativos – no docentes. El riesgo de presentar trastornos de la voz se asoció directamente con la exposición a factores de riesgo ocupacionales y aquellos asociados a condiciones de salud y al estilo de vida de los individuos, cuyas consecuencias fueron mayores para el grupo de docentes; dado que al ser la voz su principal herramienta de trabajo, el uso fue mayor y asimismo la probabilidad de desencadenar sintomatología vocal, derivada de la fatiga laríngea. La variable de fo promedio para la fonación sostenida de la vocal /a/, que representa una sonido neutro en tonalidad o el tono habitual, mostró diferencias significativas entre grupos (p=0,048). Para este caso, el grupo de docentes registró un aumento de la fo en el postest en comparación con un cambio no significativo para el grupo de administrativos luego del uso prolongado de la voz. En consecuencia, hubo diferencias en el valor registrado para la máxima fo (p =0,025), mínima fo (p=0,011) y el rango de fo (p=0,012) en la emisión sostenida de la vocal /a/. Para el caso del grupo de administrativos, las diferencias significativas estuvieron dadas por la disminución de la fo, rango y máxima y mínima frecuencia en las tres vocales (/a/, /i/, /o/) en contraste con lo ocurrido para el grupo de docentes. En la intensidad de la voz fueron encontradas también diferencias significativas entre grupos (p=0,001) con un decrecimiento del volumen en el postest, tanto promedio como mínimo, máximo y rango de la intensidad, en la fonación sostenida de la vocal /a/ para el grupo de docentes; ninguna significancia estadística fue hallada en el grupo de administrativos para estas variables. Se demostró a través de mediciones objetivas y resultados verificables, el fenómeno de la fatiga laríngea, asociados a los efectos que se presentan tras la demanda vocal continua, discriminando el impacto, entre las variables de cargo y género.
Resumo:
El objetivo es encontrar un conjunto organizado de actividades que puedan ser motivadoras en el ciclo de enseñanza secundaria. Se basa en la experiencia en diferentes centros. Se divide en 3 bloques: documento sobre los créditos de objetivos generales de etapa (organización, valoración de la experiencia, incidencia en la evaluación global de etapa); créditos de objetivos generales disponibles; ejemplos de créditos de objetivos generales. A modo de ejemplo aparecen las siguientes actividades: audio-visual sobre las marismas del Empordà, el mercado de Hostafrancs, estudio de una colonia textil.