935 resultados para Vocal duets
Resumo:
De carácter ensayístico, el siguiente trabajo busca pensar cierta lógica de construcción estética que aparece, nítidamente, en el siglo XVII y bajo el diseño (dinámico) del plano en asterisco. Cierta configuración política del Estado-nación, así como la creciente extensión de un dominio imperial-colonial de la economía, ponen en primer plano el problema del espacio (y del control de su infinitud). Este fenómeno, entre otros, lleva a retrazar la antigua ciudad medieval y a reconfigurar no sólo la imagen sino la concepción de lo que una ciudad debía ser. La ciudad barroca, moderna y multitudinaria, adquiere entonces la forma de un asterisco: una plaza central y rectas avenidas irradiadas. Pero al mismo tiempo (o poco antes), el asterisco se vuelve el modo que adopta el mundo para conjurar o contener el infinito que amenaza cada plano de la vida: sea el cielo heliocéntrico de Copérnico y Galileo, la barroca fuga de puntos (y el no punto de fuga renacentista) de Bach o de Velásquez, el "mapa" imperial de una Nación, o la dispersión multitudinaria y digresiva de un narrador-lector como el del Quijote, entre otros. Este plano en asterisco, será también el dibujo más ajustado de otros problemas o invenciones barrocas, como son el punto de vista y el famoso concepto de Baltasar Gracián. A partir de allí, conceptos e ideas-forma como el pliegue (Deleuze), la hidra vocal (Egido) o la estructura radial (Carreter), configurarán cierta historia teórica del barroco, de sus procedimientos ético-estéticos, y de su obsesión por la formación y transformación de formas formadas
Resumo:
En el español rioplatense, la aspiración de /s/ preconsonántica es la norma (Terrell 1978), mientras que el debilitamiento en final de palabra ante vocal o pausa parece estar estigmatizado (Fontanella 1973; Barrios 2002). Los hablantes de este dialecto, sin embargo, tienen en principio la capacidad de controlar la tasa de debilitamiento para acercarse a diferentes normas de pronunciación, en especial en contextos de carácter formal como la interpretación de una canción. La principal hipótesis de este trabajo es que, ante una situación como esa, es esperable hallar una variación en la tasa de aspiración según cuál sea el género musical interpretado, lo cual se enlaza con resultados de estudios sociolingüísticos sobre la música popular (Trudgill 1983; Simpson 1999). En nuestro caso, el análisis se lleva a cabo sobre un corpus de 17 canciones agrupadas en dos géneros (tango y rock), y gira en torno a la figura del cantante y compositor Andrés Calamaro. El número total de realizaciones de /s/ preconsonántica relevados asciende a 701, de los cuales 393 corresponden a grabaciones de tango y 308 a grabaciones de rock. Para cada género, comparamos la tasa de aspiración de /s/ preconsonántica en las interpretaciones de Calamaro con las mismas canciones cantadas por diversos intérpretes (tanto de tango como de rock). Los resultados obtenidos a partir de la transcripción fonética fueron sometidos a un análisis de regresión múltiple (modelo logit), el cual reveló que las variables 'género' e 'intérprete' predicen significativamente controlar por factores de carácter fonético (punto y modo de articulación de la consonante siguiente, acentuación de la sílaba en la cual aparece la /s/ implosiva), posicional (/s/ intermedia o final de palabra) y gramatical (/s/ como marca verbal o de plural), y son también reinterpretados utilizando la lógica del modelo de reglas variables (varbrul). Los resultados de este trabajo indican que la /s/ preconsonántica es aspirada significativamente más en el tango que en el rock. También se verifica que, al interpretar tangos, Andrés Calamaro aspira significativamente menos dicho sonido que los cantantes que grabaron las versiones originales analizadas. Sin embargo, el propio Calamaro utiliza de manera significativamente más frecuente la aspiración cuando interpreta tangos que cuando interpreta canciones de rock. En conclusión, los resultados parecen respaldar la teoría de que los cantantes se acercan a una pronunciación más local cuando interpretan un género vernáculo (tango) y a una norma pan-hispánica cuando interpretan un género de carácter internacional (rock)
Resumo:
La voz no es sólo el sonido producido por un órgano o un sistema, la voz expresa y comunica completamente a las personas. En términos anatomofisiológicos la voz se produce gracias a la acción coordinada de varias estructuras de nuestro cuerpo. Estas estructuras coordinadas se denominan sistema fonatorio. Lo integran músculos de diferentes regiones del cuerpo, elementos del aparato respiratorio y del aparato digestivo. Esos componentes se adaptan y se coordinan para que pueda producirse el sonido humano al que llamamos voz, los cuales además se articulan y combinan en palabras y frases con las que nos comunicamos. También una adecuada alineación postural permite tener más capacidad de producir una amplia gama de sonidos en forma cómoda. El presente trabajo es una mirada de la fonación, desde una perspectiva eminentemente funcional, donde se enfatizan aspectos que nos ayudan a comprender mejor el uso vocal general y aquel que se desarrolla con fines ocupacionales y profesionales. En esta propuesta se pone el acento en el particular uso vocal en la docencia de la Educación Física en diferentes ámbitos, uso por demás exigido lo que genera abusos vocales y generalmente disfonías. Por último se ofrece algunas líneas de actuación concretas para que la situación actual se optimice y se reduzca la problemática en ésta área
Resumo:
De carácter ensayístico, el siguiente trabajo busca pensar cierta lógica de construcción estética que aparece, nítidamente, en el siglo XVII y bajo el diseño (dinámico) del plano en asterisco. Cierta configuración política del Estado-nación, así como la creciente extensión de un dominio imperial-colonial de la economía, ponen en primer plano el problema del espacio (y del control de su infinitud). Este fenómeno, entre otros, lleva a retrazar la antigua ciudad medieval y a reconfigurar no sólo la imagen sino la concepción de lo que una ciudad debía ser. La ciudad barroca, moderna y multitudinaria, adquiere entonces la forma de un asterisco: una plaza central y rectas avenidas irradiadas. Pero al mismo tiempo (o poco antes), el asterisco se vuelve el modo que adopta el mundo para conjurar o contener el infinito que amenaza cada plano de la vida: sea el cielo heliocéntrico de Copérnico y Galileo, la barroca fuga de puntos (y el no punto de fuga renacentista) de Bach o de Velásquez, el "mapa" imperial de una Nación, o la dispersión multitudinaria y digresiva de un narrador-lector como el del Quijote, entre otros. Este plano en asterisco, será también el dibujo más ajustado de otros problemas o invenciones barrocas, como son el punto de vista y el famoso concepto de Baltasar Gracián. A partir de allí, conceptos e ideas-forma como el pliegue (Deleuze), la hidra vocal (Egido) o la estructura radial (Carreter), configurarán cierta historia teórica del barroco, de sus procedimientos ético-estéticos, y de su obsesión por la formación y transformación de formas formadas
Resumo:
En el español rioplatense, la aspiración de /s/ preconsonántica es la norma (Terrell 1978), mientras que el debilitamiento en final de palabra ante vocal o pausa parece estar estigmatizado (Fontanella 1973; Barrios 2002). Los hablantes de este dialecto, sin embargo, tienen en principio la capacidad de controlar la tasa de debilitamiento para acercarse a diferentes normas de pronunciación, en especial en contextos de carácter formal como la interpretación de una canción. La principal hipótesis de este trabajo es que, ante una situación como esa, es esperable hallar una variación en la tasa de aspiración según cuál sea el género musical interpretado, lo cual se enlaza con resultados de estudios sociolingüísticos sobre la música popular (Trudgill 1983; Simpson 1999). En nuestro caso, el análisis se lleva a cabo sobre un corpus de 17 canciones agrupadas en dos géneros (tango y rock), y gira en torno a la figura del cantante y compositor Andrés Calamaro. El número total de realizaciones de /s/ preconsonántica relevados asciende a 701, de los cuales 393 corresponden a grabaciones de tango y 308 a grabaciones de rock. Para cada género, comparamos la tasa de aspiración de /s/ preconsonántica en las interpretaciones de Calamaro con las mismas canciones cantadas por diversos intérpretes (tanto de tango como de rock). Los resultados obtenidos a partir de la transcripción fonética fueron sometidos a un análisis de regresión múltiple (modelo logit), el cual reveló que las variables 'género' e 'intérprete' predicen significativamente controlar por factores de carácter fonético (punto y modo de articulación de la consonante siguiente, acentuación de la sílaba en la cual aparece la /s/ implosiva), posicional (/s/ intermedia o final de palabra) y gramatical (/s/ como marca verbal o de plural), y son también reinterpretados utilizando la lógica del modelo de reglas variables (varbrul). Los resultados de este trabajo indican que la /s/ preconsonántica es aspirada significativamente más en el tango que en el rock. También se verifica que, al interpretar tangos, Andrés Calamaro aspira significativamente menos dicho sonido que los cantantes que grabaron las versiones originales analizadas. Sin embargo, el propio Calamaro utiliza de manera significativamente más frecuente la aspiración cuando interpreta tangos que cuando interpreta canciones de rock. En conclusión, los resultados parecen respaldar la teoría de que los cantantes se acercan a una pronunciación más local cuando interpretan un género vernáculo (tango) y a una norma pan-hispánica cuando interpretan un género de carácter internacional (rock)
Resumo:
La voz no es sólo el sonido producido por un órgano o un sistema, la voz expresa y comunica completamente a las personas. En términos anatomofisiológicos la voz se produce gracias a la acción coordinada de varias estructuras de nuestro cuerpo. Estas estructuras coordinadas se denominan sistema fonatorio. Lo integran músculos de diferentes regiones del cuerpo, elementos del aparato respiratorio y del aparato digestivo. Esos componentes se adaptan y se coordinan para que pueda producirse el sonido humano al que llamamos voz, los cuales además se articulan y combinan en palabras y frases con las que nos comunicamos. También una adecuada alineación postural permite tener más capacidad de producir una amplia gama de sonidos en forma cómoda. El presente trabajo es una mirada de la fonación, desde una perspectiva eminentemente funcional, donde se enfatizan aspectos que nos ayudan a comprender mejor el uso vocal general y aquel que se desarrolla con fines ocupacionales y profesionales. En esta propuesta se pone el acento en el particular uso vocal en la docencia de la Educación Física en diferentes ámbitos, uso por demás exigido lo que genera abusos vocales y generalmente disfonías. Por último se ofrece algunas líneas de actuación concretas para que la situación actual se optimice y se reduzca la problemática en ésta área
Resumo:
De carácter ensayístico, el siguiente trabajo busca pensar cierta lógica de construcción estética que aparece, nítidamente, en el siglo XVII y bajo el diseño (dinámico) del plano en asterisco. Cierta configuración política del Estado-nación, así como la creciente extensión de un dominio imperial-colonial de la economía, ponen en primer plano el problema del espacio (y del control de su infinitud). Este fenómeno, entre otros, lleva a retrazar la antigua ciudad medieval y a reconfigurar no sólo la imagen sino la concepción de lo que una ciudad debía ser. La ciudad barroca, moderna y multitudinaria, adquiere entonces la forma de un asterisco: una plaza central y rectas avenidas irradiadas. Pero al mismo tiempo (o poco antes), el asterisco se vuelve el modo que adopta el mundo para conjurar o contener el infinito que amenaza cada plano de la vida: sea el cielo heliocéntrico de Copérnico y Galileo, la barroca fuga de puntos (y el no punto de fuga renacentista) de Bach o de Velásquez, el "mapa" imperial de una Nación, o la dispersión multitudinaria y digresiva de un narrador-lector como el del Quijote, entre otros. Este plano en asterisco, será también el dibujo más ajustado de otros problemas o invenciones barrocas, como son el punto de vista y el famoso concepto de Baltasar Gracián. A partir de allí, conceptos e ideas-forma como el pliegue (Deleuze), la hidra vocal (Egido) o la estructura radial (Carreter), configurarán cierta historia teórica del barroco, de sus procedimientos ético-estéticos, y de su obsesión por la formación y transformación de formas formadas
Resumo:
En el español rioplatense, la aspiración de /s/ preconsonántica es la norma (Terrell 1978), mientras que el debilitamiento en final de palabra ante vocal o pausa parece estar estigmatizado (Fontanella 1973; Barrios 2002). Los hablantes de este dialecto, sin embargo, tienen en principio la capacidad de controlar la tasa de debilitamiento para acercarse a diferentes normas de pronunciación, en especial en contextos de carácter formal como la interpretación de una canción. La principal hipótesis de este trabajo es que, ante una situación como esa, es esperable hallar una variación en la tasa de aspiración según cuál sea el género musical interpretado, lo cual se enlaza con resultados de estudios sociolingüísticos sobre la música popular (Trudgill 1983; Simpson 1999). En nuestro caso, el análisis se lleva a cabo sobre un corpus de 17 canciones agrupadas en dos géneros (tango y rock), y gira en torno a la figura del cantante y compositor Andrés Calamaro. El número total de realizaciones de /s/ preconsonántica relevados asciende a 701, de los cuales 393 corresponden a grabaciones de tango y 308 a grabaciones de rock. Para cada género, comparamos la tasa de aspiración de /s/ preconsonántica en las interpretaciones de Calamaro con las mismas canciones cantadas por diversos intérpretes (tanto de tango como de rock). Los resultados obtenidos a partir de la transcripción fonética fueron sometidos a un análisis de regresión múltiple (modelo logit), el cual reveló que las variables 'género' e 'intérprete' predicen significativamente controlar por factores de carácter fonético (punto y modo de articulación de la consonante siguiente, acentuación de la sílaba en la cual aparece la /s/ implosiva), posicional (/s/ intermedia o final de palabra) y gramatical (/s/ como marca verbal o de plural), y son también reinterpretados utilizando la lógica del modelo de reglas variables (varbrul). Los resultados de este trabajo indican que la /s/ preconsonántica es aspirada significativamente más en el tango que en el rock. También se verifica que, al interpretar tangos, Andrés Calamaro aspira significativamente menos dicho sonido que los cantantes que grabaron las versiones originales analizadas. Sin embargo, el propio Calamaro utiliza de manera significativamente más frecuente la aspiración cuando interpreta tangos que cuando interpreta canciones de rock. En conclusión, los resultados parecen respaldar la teoría de que los cantantes se acercan a una pronunciación más local cuando interpretan un género vernáculo (tango) y a una norma pan-hispánica cuando interpretan un género de carácter internacional (rock)
Resumo:
La voz no es sólo el sonido producido por un órgano o un sistema, la voz expresa y comunica completamente a las personas. En términos anatomofisiológicos la voz se produce gracias a la acción coordinada de varias estructuras de nuestro cuerpo. Estas estructuras coordinadas se denominan sistema fonatorio. Lo integran músculos de diferentes regiones del cuerpo, elementos del aparato respiratorio y del aparato digestivo. Esos componentes se adaptan y se coordinan para que pueda producirse el sonido humano al que llamamos voz, los cuales además se articulan y combinan en palabras y frases con las que nos comunicamos. También una adecuada alineación postural permite tener más capacidad de producir una amplia gama de sonidos en forma cómoda. El presente trabajo es una mirada de la fonación, desde una perspectiva eminentemente funcional, donde se enfatizan aspectos que nos ayudan a comprender mejor el uso vocal general y aquel que se desarrolla con fines ocupacionales y profesionales. En esta propuesta se pone el acento en el particular uso vocal en la docencia de la Educación Física en diferentes ámbitos, uso por demás exigido lo que genera abusos vocales y generalmente disfonías. Por último se ofrece algunas líneas de actuación concretas para que la situación actual se optimice y se reduzca la problemática en ésta área
Resumo:
Recordings from the PerenniAL Acoustic Observatory in the Antarctic ocean (PALAOA) show seasonal acoustic presence of 4 Antarctic ice-breeding seal species (Ross seal, Ommatophoca rossii, Weddell seal, Leptonychotes weddellii, crabeater, Lobodon carcinophaga, and leopard seal, Hydrurga leptonyx). Apart from Weddell seals, inhabiting the fast-ice in Atka Bay, the other three (pack-ice) species however have to date never (Ross and leopard seal) or only very rarely (crabeater seals) been sighted in the Atka Bay region. The aim of the PASATA project is twofold: the large passive acoustic hydrophone array (hereafter referred to as large array) aims to localize calling pack-ice pinniped species to obtain information on their location and hence the ice habitat they occupy. This large array consists of four autonomous passive acoustic recorders with a hydrophone sensor deployed through a drilled hole in the sea ice. The PASATA recordings are time-stamped and can therefore be coupled to the PALAOA recordings so that the hydrophone array spans the bay almost entirely from east to west. The second, smaller hydrophone array (hereafter referred to as small array), also consists of four autonomous passive acoustic recorders with hydrophone sensors deployed through drilled holes in the sea ice. The smaller array was deployed within a Weddell seal breeding colony, located further south in the bay, just off the ice shelf. Male Weddell seals are thought to defend underwater territories around or near tide cracks and breathing holes used by females. Vocal activity increases strongly during the breeding season and vocalizations are thought to be used underwater by males for the purpose of territorial defense and advertisement. With the smaller hydrophone array we aim to investigate underwater behaviour of vocalizing male and female Weddell seals to provide further information on underwater movement patterns in relation to the location of tide cracks and breathing holes. As a pilot project, one on-ice and three underwater camera systems have been deployed near breathing holes to obtain additional visual information on Weddell seal behavioural activity. Upon each visit in the breeding colony, a census of colony composition on the ice (number of animals, sex, presence of dependent pups, presence and severity of injuries-indicative of competition intensity) as well as GPS readings of breathing holes and positions of hauled out Weddell seals are taken.
Resumo:
Este trabajo de Tesis ha abordado el objetivo de dar robustez y mejorar la Detección de Actividad de Voz en entornos acústicos adversos con el fin de favorecer el comportamiento de muchas aplicaciones vocales, por ejemplo aplicaciones de telefonía basadas en reconocimiento automático de voz, aplicaciones en sistemas de transcripción automática, aplicaciones en sistemas multicanal, etc. En especial, aunque se han tenido en cuenta todos los tipos de ruido, se muestra especial interés en el estudio de las voces de fondo, principal fuente de error de la mayoría de los Detectores de Actividad en la actualidad. Las tareas llevadas a cabo poseen como punto de partida un Detector de Actividad basado en Modelos Ocultos de Markov, cuyo vector de características contiene dos componentes: la energía normalizada y la variación de la energía. Las aportaciones fundamentales de esta Tesis son las siguientes: 1) ampliación del vector de características de partida dotándole así de información espectral, 2) ajuste de los Modelos Ocultos de Markov al entorno y estudio de diferentes topologías y, finalmente, 3) estudio e inclusión de nuevas características, distintas de las del punto 1, para filtrar los pulsos de pronunciaciones que proceden de las voces de fondo. Los resultados de detección, teniendo en cuenta los tres puntos anteriores, muestran con creces los avances realizados y son significativamente mejores que los resultados obtenidos, bajo las mismas condiciones, con otros detectores de actividad de referencia. This work has been focused on improving the robustness at Voice Activity Detection in adverse acoustic environments in order to enhance the behavior of many vocal applications, for example telephony applications based on automatic speech recognition, automatic transcription applications, multichannel systems applications, and so on. In particular, though all types of noise have taken into account, this research has special interest in the study of pronunciations coming from far-field speakers, the main error source of most activity detectors today. The tasks carried out have, as starting point, a Hidden Markov Models Voice Activity Detector which a feature vector containing two components: normalized energy and delta energy. The key points of this Thesis are the following: 1) feature vector extension providing spectral information, 2) Hidden Markov Models adjustment to environment and study of different Hidden Markov Model topologies and, finally, 3) study and inclusion of new features, different from point 1, to reject the pronunciations coming from far-field speakers. Detection results, taking into account the above three points, show the advantages of using this method and are significantly better than the results obtained under the same conditions by other well-known voice activity detectors.
Resumo:
The dramatic impact of neurological degenerative pathologies in life quality is a growing concern. It is well known that many neurological diseases leave a fingerprint in voice and speech production. Many techniques have been designed for the detection, diagnose and monitoring the neurological disease. Most of them are costly or difficult to extend to primary attention medical services. Through the present paper it will be shown how some neurological diseases can be traced at the level of phonation. The detection procedure would be based on a simple voice test. The availability of advanced tools and methodologies to monitor the organic pathology of voice would facilitate the implantation of these tests. The paper hypothesizes that some of the underlying mechanisms affecting the production of voice produce measurable correlates in vocal fold biomechanics. A general description of the methodological foundations for the voice analysis system which can estimate correlates to the neurological disease is shown. Some study cases will be presented to illustrate the possibilities of the methodology to monitor neurological diseases by voice
Resumo:
The purpose of this document is to serve as the printed material for the seminar "An Introductory Course on Constraint Logic Programming". The intended audience of this seminar are industrial programmers with a degree in Computer Science but little previous experience with constraint programming. The seminar itself has been field tested, prior to the writing of this document, with a group of the application programmers of Esprit project P23182, "VOCAL", aimed at developing an application in scheduling of field maintenance tasks in the context of an electric utility company. The contents of this paper follow essentially the flow of the seminar slides. However, there are some differences. These differences stem from our perception from the experience of teaching the seminar, that the technical aspects are the ones which need more attention and clearer explanations in the written version. Thus, this document includes more examples than those in the slides, more exercises (and the solutions to them), as well as four additional programming projects, with which we hope the reader will obtain a clearer view of the process of development and tuning of programs using CLP. On the other hand, several parts of the seminar have been taken out: those related with the account of fields and applications in which C(L)P is useful, and the enumerations of C(L)P tools available. We feel that the slides are clear enough, and that for more information on available tools, the interested reader will find more up-to-date information by browsing the Web or asking the vendors directly. More details in this direction will actually boil down to summarizing a user manual, which is not the aim of this document.
Resumo:
BioMet®Tools is a set of software applications developed for the biometrical characterization of voice in different fields as voice quality evaluation in laryngology, speech therapy and rehabilitation, education of the singing voice, forensic voice analysis in court, emotional detection in voice, secure access to facilities and services, etc. Initially it was conceived as plain research code to estimate the glottal source from voice and obtain the biomechanical parameters of the vocal folds from the spectral density of the estimate. This code grew to what is now the Glottex®Engine package (G®E). Further demands from users in medical and forensic fields instantiated the development of different Graphic User Interfaces (GUI’s) to encapsulate user interaction with the G®E. This required the personalized design of different GUI’s handling the same G®E. In this way development costs and time could be saved. The development model is described in detail leading to commercial production and distribution. Study cases from its application to the field of laryngology and speech therapy are given and discussed.
Resumo:
La medicina ha evolucionado de forma que las imágenes digitales tienen un papel de gran relevancia para llevar a cabo el diagnóstico de enfermedades. Son muchos y de diversa naturaleza los problemas que pueden presentar el aparato fonador. Un paso previo para la caracterización de imágenes digitales de la laringe es la segmentación de las cuerdas vocales. Hasta el momento se han desarrollado algoritmos que permiten la segmentación de la glotis. El presente proyecto pretende avanzar un paso más en el estudio, procurando asimismo la segmentación de las cuerdas vocales. Para ello, es necesario aprovechar la información de color que ofrecen las imágenes, pues es lo que va a determinar la diferencia entre una región y otra de la imagen. En este proyecto se ha desarrollado un novedoso método de segmentación de imágenes en color estroboscópicas de la laringe basado en el crecimiento de regiones a partir de píxeles-semilla. Debido a los problemas que presentan las imágenes obtenidas por la técnica de la estroboscopia, para conseguir óptimos resultados de la segmentación es necesario someter a las imágenes a un preprocesado, que consiste en la eliminación de altos brillos y aplicación de un filtro de difusión anisotrópica. Tras el preprocesado, comienza el crecimiento de la región a partir de unas semillas que se obtienen previamente. La condición de inclusión de un píxel en la región se basa en un parámetro de tolerancia que se determina de forma adaptativa. Este parámetro comienza teniendo un valor muy bajo y va aumentando de forma recursiva hasta alcanzar una condición de parada. Esta condición se basa en el análisis de la distribución estadística de los píxeles dentro de la región que va creciendo. La última fase del proyecto consiste en la realización de las pruebas necesarias para verificar el funcionamiento del sistema diseñado, obteniéndose buenos resultados en la segmentación de la glotis y resultados esperanzadores para seguir mejorando el sistema para la segmentación de las cuerdas vocales. ABSTRACT Medicine has evolved so that digital images have a very important role to perform disease diagnosis. There are wide variety of problems that can present the vocal apparatus. A preliminary step for characterization of digital images of the larynx is the segmentation of the vocal folds. To date, some algorithms that allow the segmentation of the glottis have been developed. This project aims to go one step further in the study, also seeking the segmentation of the vocal folds. To do this, we must use the color information offered by images, since this is what will determine the difference between different regions in a picture. In this project a novel method of larynx color images segmentation based on region growing from a pixel seed is developed. Due to the problems of the images obtained by the technique of stroboscopy, to achieve optimal results of the segmentation is necessary a preprocessing of the images, which involves the removal of high brightness and applying an anisotropic diffusion filter. After this preprocessing, the growth of the region from previously obtained seeds starts. The condition for inclusion of a pixel in the region is based on a tolerance parameter, which is adaptively determined. It initially has a low value and this is recursively increased until a stop condition is reached. This condition is based on the analysis of the statistical distribution of the pixels within the grown region. The last phase of the project involves the necessary tests to verify the proper working of the designed system, obtaining very good results in the segmentation of the glottis and encouraging results to keep improving the system for the segmentation of the vocal folds.