998 resultados para Speech segmentation
Resumo:
In image segmentation, clustering algorithms are very popular because they are intuitive and, some of them, easy to implement. For instance, the k-means is one of the most used in the literature, and many authors successfully compare their new proposal with the results achieved by the k-means. However, it is well known that clustering image segmentation has many problems. For instance, the number of regions of the image has to be known a priori, as well as different initial seed placement (initial clusters) could produce different segmentation results. Most of these algorithms could be slightly improved by considering the coordinates of the image as features in the clustering process (to take spatial region information into account). In this paper we propose a significant improvement of clustering algorithms for image segmentation. The method is qualitatively and quantitative evaluated over a set of synthetic and real images, and compared with classical clustering approaches. Results demonstrate the validity of this new approach
Resumo:
In this paper a novel rank estimation technique for trajectories motion segmentation within the Local Subspace Affinity (LSA) framework is presented. This technique, called Enhanced Model Selection (EMS), is based on the relationship between the estimated rank of the trajectory matrix and the affinity matrix built by LSA. The results on synthetic and real data show that without any a priori knowledge, EMS automatically provides an accurate and robust rank estimation, improving the accuracy of the final motion segmentation
Resumo:
A novel technique for estimating the rank of the trajectory matrix in the local subspace affinity (LSA) motion segmentation framework is presented. This new rank estimation is based on the relationship between the estimated rank of the trajectory matrix and the affinity matrix built with LSA. The result is an enhanced model selection technique for trajectory matrix rank estimation by which it is possible to automate LSA, without requiring any a priori knowledge, and to improve the final segmentation
Resumo:
--
Resumo:
Resumen tomado de la revista
Resumo:
Resumen en español
Resumo:
Resumen basado en el de la publicación. Resumen en español
Resumo:
Este recurso describe cómo una proporción significativa de niños en edad escolar tienen dificultades en el habla y cómo éstas afectan negativamente en su aprendizaje, tanto en entornos especializados como en generales. En él se esbozan las principales áreas de dificultad para los alumnos, y sugiere cómo los profesores pueden hacer que el programa sea más accesible para facilitar el aprendizaje. Se tratan el lenguaje expresivo, el lenguaje receptivo, el uso social del lenguaje y dificultades en el desarrollo de la coordinación, así como temas específicos como el plan de estudios de inglés, matemáticas y ciencias. A lo largo de la publicación hay información e ideas para apoyar a estos alumnos, y una amplia selección de sugerencias de buenas prácticas. Se incluye un programa de habilidades motoras, rimas para la producción del habla, trabajo de memoria, y páginas fotocopiables de diccionario.
Resumo:
Este manual presenta las ideas actuales sobre la relación entre lo hablado y lo escrito y sus dificultades lingüísticas. Proporciona perspectivas clínicas y educativas sobre la evaluación y gestión de lectura y ortografía de los niños. Comienza con una introducción teórica y sigue con la vinculación entre teoría y práctica. Está dirigido a los profesionales en los campos de educación, intervención y terapia del lenguaje, y psicología.
Resumo:
El estudio científico de los efectos de la palabra complementada (cued speech) en la compresión verbal, o más concretamente, en el aspecto de la recepción de la palabra hablada, en el aprendizaje verbal del niño sordo profundo frente a otros sistemas oralistas de rehabilitación. Compuesta por 20 niños sordos profundos, alumnos del centro de rehabilitación del lenguaje y audición 'Príncipe de Asturias' de Cartagena, diagnosticados con sordera bilateral profunda. Todos ellos eran sordos prelocutivos y todos han tenido antes de la aplicación de las pruebas aquí presentadas al menos 5 años de rehabilitación logopédica de orientación oralista. Las edades fueron entre 7 y 10 años. Todos estaban escolarizados en ciclo inicial o medio de EGB. Diseño intrasujeto. Las variables controladas independientes fueron: A) Aplicación individual. B) Control auditivo y momento auditivo óptimo. C) Disposición positiva del sujeto para el trabajo. D) Evitación del aprendizaje. E) Preparación psicológica del sujeto. F) Explicación de la tarea a realizar y sus objetivos. Se le presentaron al sujeto 66 logotomas para cada una de las siete combinaciones del experimento. Los grupos de palabras fueron 6 y cada grupo comprende 18 palabras. La evaluación se realizó mediante dos pruebas 'ad hoc': 1. Logotomas o silabas sin sentido. 2. Palabras clave dentro del contexto lingüístico, y que a su vez se subdivide en dos tipos: A) Palabra clave en contexto previsible. B) Palabra clave en contexto poco previsible. Tabla de frecuencias absolutas. Equipo de vídeo para pruebas lingüísticas (recepción). Audiómetro modelo Amplaid 30. Equipo Suvag. Estadística no paramétrica (pequeños grupos). Se utilizó un ANOVA, que permitió calcular una 'F omnibus': prueba de T para los logotomas y palabras clave. El tratamiento estadístico y de textos se llevó a cabo mediante el software: Display writer 3, dBase III, Microsta estadística y epistat estadística. El cued speech es válido para llevar al niño sordo profundo a un nivel de recepción de la palabra similar al del niño oyente de su misma edad. Es más eficaz al simultanearlo con la lectura labiofacial. El cueed speech se revela independiente de los restos auditivos. La recepción verbal captada por el niño sordo mediante varias vías simultaneamente, mejora los resultados. Entre esta simultaneidad se revela como más eficiente la pareja labiolectora T kinemas (complementos manuales). El cued speech nos llega con un soporte técnico de avanzada tecnología. La recepción lingüística ofrecida al niño sordo profundo mediante varias vías de información mejora los resultados, y en concreto se confirma que las dos vías con las que se alcanzan los resultados más elevados son el uso simultáneo de la lectura labiofacial y los complementos del cued speech.
Resumo:
In image processing, segmentation algorithms constitute one of the main focuses of research. In this paper, new image segmentation algorithms based on a hard version of the information bottleneck method are presented. The objective of this method is to extract a compact representation of a variable, considered the input, with minimal loss of mutual information with respect to another variable, considered the output. First, we introduce a split-and-merge algorithm based on the definition of an information channel between a set of regions (input) of the image and the intensity histogram bins (output). From this channel, the maximization of the mutual information gain is used to optimize the image partitioning. Then, the merging process of the regions obtained in the previous phase is carried out by minimizing the loss of mutual information. From the inversion of the above channel, we also present a new histogram clustering algorithm based on the minimization of the mutual information loss, where now the input variable represents the histogram bins and the output is given by the set of regions obtained from the above split-and-merge algorithm. Finally, we introduce two new clustering algorithms which show how the information bottleneck method can be applied to the registration channel obtained when two multimodal images are correctly aligned. Different experiments on 2-D and 3-D images show the behavior of the proposed algorithms
Resumo:
In this paper, an information theoretic framework for image segmentation is presented. This approach is based on the information channel that goes from the image intensity histogram to the regions of the partitioned image. It allows us to define a new family of segmentation methods which maximize the mutual information of the channel. Firstly, a greedy top-down algorithm which partitions an image into homogeneous regions is introduced. Secondly, a histogram quantization algorithm which clusters color bins in a greedy bottom-up way is defined. Finally, the resulting regions in the partitioning algorithm can optionally be merged using the quantized histogram
Resumo:
En aquesta tesi s’estudia el problema de la segmentació del moviment. La tesi presenta una revisió dels principals algoritmes de segmentació del moviment, s’analitzen les característiques principals i es proposa una classificació de les tècniques més recents i importants. La segmentació es pot entendre com un problema d’agrupament d’espais (manifold clustering). Aquest estudi aborda alguns dels reptes més difícils de la segmentació de moviment a través l’agrupament d’espais. S’han proposat nous algoritmes per a l’estimació del rang de la matriu de trajectòries, s’ha presenta una mesura de similitud entre subespais, s’han abordat problemes relacionats amb el comportament dels angles canònics i s’ha desenvolupat una eina genèrica per estimar quants moviments apareixen en una seqüència. L´ultima part de l’estudi es dedica a la correcció de l’estimació inicial d’una segmentació. Aquesta correcció es du a terme ajuntant els problemes de la segmentació del moviment i de l’estructura a partir del moviment.