3 resultados para Saliencia

em Universidad Politécnica de Madrid


Relevância:

20.00% 20.00%

Publicador:

Resumo:

La proliferación en todos los ámbitos de la producción multimedia está dando lugar a la aparición de nuevos paradigmas de recuperación de información visual. Dentro de éstos, uno de los más significativos es el de los sistemas de recuperación de información visual, VIRS (Visual Information Retrieval Systems), en los que una de las tareas más representativas es la ordenación de una población de imágenes según su similitud con un ejemplo dado. En este trabajo se presenta una propuesta original para la evaluación de la similitud entre dos imágenes, basándose en la extensión del concepto de saliencia desde el espacio de imágenes al de características para establecer la relevancia de cada componente de dicho vector. Para ello se introducen metodologías para la cuantificación de la saliencia de valores individuales de características, para la combinación de estas cuantificaciones en procesos de comparación entre dos imágenes, y para, finalmente, establecer la mencionada ponderación de cada característica en atención a esta combinación. Se presentan igualmente los resultados de evaluar esta propuesta en una tarea de recuperación de imágenes por contenido en comparación con los obtenidos con la distancia euclídea. Esta comparación se realiza mediante la evaluación de ambos resultados por voluntarios.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Según la Organización de Aviación Civil Internacional (OACI), las cartas aeronáuticas son un medio adecuado para el suministro de información aeronáutica de manera manejable, condensada y coordinada. Sobre esta cartografía temática los editores autorizados sintetizan datos específicos relacionados con la orientación espacial y la salvaguarda de la seguridad del vuelo. En consecuencia, se postulan como un recurso de referencia básico para la planificación, el control de tránsito aéreo y la propia navegación aérea. Mediante una indagación inicial, en la cual participaron más de 250 pilotos españoles de aviación civil, se revelaron múltiples ineficiencias en el sistema de comunicación gráfica de las cartas aeronáuticas. Su constatación nos lleva a plantear, como punto de partida, que las innovaciones metodológicas que puedan ser alcanzadas, en lo referente a la expresión gráfica de los modelos cartográficos para la navegación aérea, tendrán plena actualidad y recorrido en el contexto conceptual, tecnológico y científico de la información aeronáutica. En consecuencia, se plantea la necesidad de proponer estrategias o pautas de simbolización basadas en el estudio de la interferencia entre conjuntos de símbolos agrupados en distintos ámbitos o niveles de significado o realidad. El fin último es conseguir, en el caso de las cartas aeronáuticas complejas, una carga visual adecuada y ponderada que facilite y mejore la percepción e interpretación durante las labores de vuelo visual. Este propósito se ha materializado en el diseño de una serie de prototipos que tratan así de mejorar la comunicabilidad de las cartas aeronáuticas complejas, en términos de comprensión y legibilidad del mensaje portado. Para alcanzar este objetivo, la metodología propuesta ha sido dividida en tareas sucesivas: (a) caracterizar la utilización práctica de la información geo-aeronáutica, (b) concretar un conjunto limitado de cartas estereotipadas, (c) diseñar y aplicar una metodología para el análisis de la eficiencia comunicacional, (d) determinar la influencia perceptual provocada por la combinación de variables visuales en la representación y, finalmente, (e) el diseño y evaluación de un prototipo de mejora. Una vez analizado un conjunto de Cartas de Aproximación Visual (VAC) vigentes de ediciones características de distintas regiones y continentes, se ha constatado que la observancia de los distintos principios relativos a factores humanos es manifiestamente mejorable. Adicionalmente existe una llamativa diversidad al respecto entre las series de los distintos Servicios de Información Aeronáutica (AIS) autorizados; este hecho se ha sistematizado mediante una escala de grados, permitiendo así calcular la intensidad de cambio o diferencia existente en cada uno de los símbolos analizados con respecto a la especificación simbólica recomendada de OACI. A partir de la sistematización anterior, se ha alcanzado un estereotipado de tendencias de simbolización, permitiendo así elaborar una serie de modelos de representación cartográfica estereotipo. Aplicando algoritmos de saliencia, se han calculado las capacidades de prominencia visual y de atención temprana de cada uno de ellos. A su vez, mediante técnicas de seguimiento ocular, se han cotejado las cualidades comunicativas calculadas de forma teórica con las medidas en una actividad de lectura e interpretación, en la que participaron pilotos militares y profesionales de la información geográfica. Los resultados obtenidos permiten afirmar que es factible predecir de forma básica las capacidades de atención temprana de los objetos gráficos que componen una carta aeronáutica, posibilitando dirigir de forma planificada la atención visual del lector hacia determinados elementos y símbolos, según el propósito que tenga cada carta en particular. Adicionalmente se ha constatado que una adecuación en términos de contraste relacional y combinatoria de variables visuales mejora la eficiencia de los recorridos visuales, optimiza la duración de las fijaciones oculares y, como resultado, se reduce el tiempo de adquisición de la información en la lectura de las cartas aeronáuticas. En consecuencia, tomando en consideración los requerimientos de factores humanos como parámetros de calidad para que el lenguaje gráfico alcance una comunicabilidad adecuada, podemos afirmar que puede mejorarse la eficiencia comunicacional de las cartas aeronáuticas, en términos de velocidad, claridad y cantidad de información que se puede ser percibida y procesada con respecto al desempeño humano óptimo.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La medida de calidad de vídeo sigue siendo necesaria para definir los criterios que caracterizan una señal que cumpla los requisitos de visionado impuestos por el usuario. Las nuevas tecnologías, como el vídeo 3D estereoscópico o formatos más allá de la alta definición, imponen nuevos criterios que deben ser analizadas para obtener la mayor satisfacción posible del usuario. Entre los problemas detectados durante el desarrollo de esta tesis doctoral se han determinado fenómenos que afectan a distintas fases de la cadena de producción audiovisual y tipo de contenido variado. En primer lugar, el proceso de generación de contenidos debe encontrarse controlado mediante parámetros que eviten que se produzca el disconfort visual y, consecuentemente, fatiga visual, especialmente en lo relativo a contenidos de 3D estereoscópico, tanto de animación como de acción real. Por otro lado, la medida de calidad relativa a la fase de compresión de vídeo emplea métricas que en ocasiones no se encuentran adaptadas a la percepción del usuario. El empleo de modelos psicovisuales y diagramas de atención visual permitirían ponderar las áreas de la imagen de manera que se preste mayor importancia a los píxeles que el usuario enfocará con mayor probabilidad. Estos dos bloques se relacionan a través de la definición del término saliencia. Saliencia es la capacidad del sistema visual para caracterizar una imagen visualizada ponderando las áreas que más atractivas resultan al ojo humano. La saliencia en generación de contenidos estereoscópicos se refiere principalmente a la profundidad simulada mediante la ilusión óptica, medida en términos de distancia del objeto virtual al ojo humano. Sin embargo, en vídeo bidimensional, la saliencia no se basa en la profundidad, sino en otros elementos adicionales, como el movimiento, el nivel de detalle, la posición de los píxeles o la aparición de caras, que serán los factores básicos que compondrán el modelo de atención visual desarrollado. Con el objetivo de detectar las características de una secuencia de vídeo estereoscópico que, con mayor probabilidad, pueden generar disconfort visual, se consultó la extensa literatura relativa a este tema y se realizaron unas pruebas subjetivas preliminares con usuarios. De esta forma, se llegó a la conclusión de que se producía disconfort en los casos en que se producía un cambio abrupto en la distribución de profundidades simuladas de la imagen, aparte de otras degradaciones como la denominada “violación de ventana”. A través de nuevas pruebas subjetivas centradas en analizar estos efectos con diferentes distribuciones de profundidades, se trataron de concretar los parámetros que definían esta imagen. Los resultados de las pruebas demuestran que los cambios abruptos en imágenes se producen en entornos con movimientos y disparidades negativas elevadas que producen interferencias en los procesos de acomodación y vergencia del ojo humano, así como una necesidad en el aumento de los tiempos de enfoque del cristalino. En la mejora de las métricas de calidad a través de modelos que se adaptan al sistema visual humano, se realizaron también pruebas subjetivas que ayudaron a determinar la importancia de cada uno de los factores a la hora de enmascarar una determinada degradación. Los resultados demuestran una ligera mejora en los resultados obtenidos al aplicar máscaras de ponderación y atención visual, los cuales aproximan los parámetros de calidad objetiva a la respuesta del ojo humano. ABSTRACT Video quality assessment is still a necessary tool for defining the criteria to characterize a signal with the viewing requirements imposed by the final user. New technologies, such as 3D stereoscopic video and formats of HD and beyond HD oblige to develop new analysis of video features for obtaining the highest user’s satisfaction. Among the problems detected during the process of this doctoral thesis, it has been determined that some phenomena affect to different phases in the audiovisual production chain, apart from the type of content. On first instance, the generation of contents process should be enough controlled through parameters that avoid the occurrence of visual discomfort in observer’s eye, and consequently, visual fatigue. It is especially necessary controlling sequences of stereoscopic 3D, with both animation and live-action contents. On the other hand, video quality assessment, related to compression processes, should be improved because some objective metrics are adapted to user’s perception. The use of psychovisual models and visual attention diagrams allow the weighting of image regions of interest, giving more importance to the areas which the user will focus most probably. These two work fields are related together through the definition of the term saliency. Saliency is the capacity of human visual system for characterizing an image, highlighting the areas which result more attractive to the human eye. Saliency in generation of 3DTV contents refers mainly to the simulated depth of the optic illusion, i.e. the distance from the virtual object to the human eye. On the other hand, saliency is not based on virtual depth, but on other features, such as motion, level of detail, position of pixels in the frame or face detection, which are the basic features that are part of the developed visual attention model, as demonstrated with tests. Extensive literature involving visual comfort assessment was looked up, and the development of new preliminary subjective assessment with users was performed, in order to detect the features that increase the probability of discomfort to occur. With this methodology, the conclusions drawn confirmed that one common source of visual discomfort was when an abrupt change of disparity happened in video transitions, apart from other degradations, such as window violation. New quality assessment was performed to quantify the distribution of disparities over different sequences. The results confirmed that abrupt changes in negative parallax environment produce accommodation-vergence mismatches derived from the increasing time for human crystalline to focus the virtual objects. On the other side, for developing metrics that adapt to human visual system, additional subjective tests were developed to determine the importance of each factor, which masks a concrete distortion. Results demonstrated slight improvement after applying visual attention to objective metrics. This process of weighing pixels approximates the quality results to human eye’s response.