1000 resultados para Microscopia de vídeo Teses
Resumo:
Uno de los aspectos fundamentales en un sistema de ciruga guiada por imagen (CGI) es la localizacin del instrumental quirrgico con respecto a la anatoma del paciente. Los sistemas basados en sensores ofrecen buenos niveles de precisin, pero son sensibles a distintas fuentes de ruido en el quirfano y contribuyen a la sobrecarga tecnolgica del mismo. Una alternativa novedosa es analizar la imagen del vídeo endoscpico para llevar a cabo la deteccin y localizacin espacial del instrumental. Se presenta en este trabajo la validacin de dos mtodos, basados en el dimetro aparente y en la seccin transversal del instrumental, para la localizacin espacial del instrumental a partir de los bordes y la posicin 2D de la punta en la imagen. La validacin, llevada a cabo en un simulador fsico, se realiza comparando los resultados con el sistema Kinescan/IBV. Los resultados muestran para cada mtodo un error medio de 12,7 y 12,8 mm respectivamente. La incorporacin de estos algoritmos dentro del paradigma de navegacin propuesto en el proyecto THEMIS permitir al cirujano conocer la posicin del instrumental de forma no intrusiva y transparente, sin necesidad de equipamiento adicional en el quirfano.
Resumo:
El vídeo quirrgico es la principal fuente de informacin intraoperatoria para el seguimiento de la intervencin quirrgica. Actualmente, su uso como medio de anlisis no se halla implantado. Este trabajo presenta su utilidad con casos de uso reales que explotan la informacin presente en los vídeos a travs del procesamiento de los vídeos. Los algoritmos desarrollados permiten la segmentacin y seguimiento de los elementos de la escena, la reconstruccin y la localizacin espacial de los trcares. Se presenta a modo de ejemplos un entorno de formacin y un sistema de navegacin quirrgica que explotan la informacin presente en los vídeos captados por el endoscopio.
Resumo:
El anlisis de vídeo laparoscpico ofrece nuevas posibilidades a la navegacin quirrgica al garantizar una incorporacin mnima de tecnologa en quirfano, evitando as alterar la ergonoma y los flujos de trabajo de las intervenciones. Una de sus principales ventajas es que puede servir como fuente de datos para reconstruir tridimensionalmente la escena laparoscpica, lo que permite dotar al cirujano de la sensacin de profundidad perdida en este tipo de ciruga. En el presente trabajo de investigacin se comparan dos detectores de puntos singulares, SIFT y SURF, para estimar cul de los dos podra integrarse en un algoritmo de clculo de coordenadas 3D, MonoSLAM, basado en la deteccin y el seguimiento de estos puntos singulares en los fotogramas del vídeo. Los resultados obtenidos posicionan a SURF como la mejor opcin gracias a su rapidez y a su mayor capacidad de discriminacin entre estructuras anatmicas e instrumental quirrgico.
Resumo:
Desde hace ya muchos aos, uno de los servicios de telecomunicaciones ms demandado por los espaoles ha sido la televisin de pago, complementando y ampliando la oferta de contenidos audiovisuales que habitualmente son ofrecidos de manera gratuita por la televisin analgica y recientemente por la televisin digital terrestre o TDT. Estos servicios de video, han sido tradicionalmente ofrecidos por operadores satlites, operadores de cable u otros operadores de telecomunicaciones con los que a travs de una conexin de datos (ADSL, VDSL o fibra ptica), ofrecan sus contenidos a travs de IP. La propia evolucin y mejora de la tecnologa utilizada para la emisin de contenidos sobre IP, ha permitido que a da de hoy, la televisin se conciba como un servicio Over The Top (OTT) ajeno al medio de transmisin, permitiendo a cualquier agente, distribuir sus contenidos audiovisuales de manera sencilla y a todos sus clientes en todas las partes del mundo; siendo solamente necesario disponer de una conexin a internet. De esta manera, el proyecto desarrollado va a girar en torno a la herramienta StormTest de la empresa S3Group, comprada por CENTUM Solutions (empresa especializada en ofrecer servicio de ingeniera para sistema de comunicaciones, control e inteligencia de seal) con el objetivo de satisfacer las necesidades de sus clientes y con la que en definitiva se ha contado para la realizacin de este proyecto. El principal objetivo de este proyecto es la definicin e implementacin de un banco de pruebas que permita optimizar los procesos de validacin tcnica, mejorando los tiempos de ejecucin y concentrando la actividad de los ingenieros en tareas de mayor valor. Para la realizacin de este proyecto, se han fijado diversos objetivos necesarios para el desarrollo de este tipo de actividades. Los principales son los siguientes: Anlisis de la problemtica actual: donde en los procesos de aceptacin tcnica se dedica muchas horas de trabajo para la realizacin de pruebas repetitivas y de poco valor las cuales se pueden automatizar por herramientas existentes en el mercado. Bsqueda y seleccin de una herramienta que satisfaga las necesidades de pruebas. Instalacin en los laboratorios. Configuracin y adaptacin de la herramienta a las necesidades y proyectos especficos. Con todo ello, este proyecto cubrir los siguientes logros: Reducir los tiempos de ejecucin de las campaas de pruebas, gracias a la automatizacin de gran parte ellas. Realizar medidas de calidad subjetiva y objetiva complejas, imposibles de ejecutar a travs de las personas. Mejorar y automatizar los sistemas de reporte de resultados. Abstract: Many years ago, one of the telecommunications services most demanded in Spain has been pay television, complementing and extending the offer of audiovisual content which are usually offered for free by analog tv and recently by digital terrestrial televisin or TDT. These video services, have been traditionally offered by satellite operators, cable operators or other telecommunications operators that through a data connection (ADSL,VDSL or fiber optic), offered its content over IP. The evolution and improvement of the technology used for broadcasting over IP, has allowed that to date, television is conceived as a service Over The Top (OTT), not dependent on the transmission medium, allowing any agent to distribute audiovisual content in a very simple way and to all its customers in all parts of the world; being only necessary to have an decent internet connection. In this way, the project will have relation with S3Groups StormTest tool, bought by CENTUM Solutions (company specialized in engineering services for communications, control and signal intelligence system) with the aim of satisfying the needs of its customers and which ultimately has counted for the realization of this project. The main objective of this project is the definition and implementation of a test bench that allows to optimize the processes of technical validation, improving execution times and concentrating the activities of engineers on higher value tasks. For the realization of this project, it has been defined several objectives necessary for the development of this type of activity. The most important tones are listed below: Analysis of the current situation: where in technical acceptance processes it is dedicated many hours of work for the completion of repetitive testing and without value which can be automated by tools available on the market Search and selection of a tool that meets the needs of testing. Installation on the laboratories. Configuration and customization of the tool to specific projects. With all this, this project will cover the following achievements: Reduce the execution time of the testing campaigns, thanks to the automation of many of them. Measurements of subjective and objective quality tests, impossible to run with engineers (due to subjective perception). Improve and automate reporting of results systems
Resumo:
En los ltimos aos, debido al notable desarrollo de los terminales porttiles, que han pasado de ser simples telfonos o reproductores a puros ordenadores, ha crecido el nmero de servicios que ofrecen cada vez mayor cantidad de contenido multimedia a travs de internet. Adems, la distinta evolucin de estos terminales hace que nos encontremos en el mercado con una amplsima gama de productos de diferentes tamaos y capacidades de procesamiento, lo que hace necesario encontrar una frmula que permita satisfacer la demanda de dichos servicios sea cual sea la naturaleza de nuestro dispositivo. Para poder ofrecer una solucin adecuada se ha optado por la integracin de un protocolo como RTP y un estndar de video como SVC. RTP (Real-time Transport Protocol), en contraposicin a los protocolos de propsito general fue diseado para aplicaciones de tiempo real por lo que es ideal para el streaming de contenido multimedia. Por su parte, SVC es un estndar de video escalable que permite transmitir en un mismo stream una capa base y mltiples capas de mejora, por lo que podremos adaptar la calidad y tamao del contenido a la capacidad y tamao de nuestro dispositivo. El objetivo de este proyecto consiste en integrar y modificar tanto el reproductor MPlayer como la librera RTP live555 de tal forma que sean capaces de soportar el formato SVC sobre el protocolo RTP y montar un sistema servidorcliente para comprobar su funcionamiento. Aunque este proceso est orientado a llevarse a cabo en un dispositivo mvil, para este proyecto se ha optado por realizarlo en el escenario ms sencillo posible, para lo cual, se emitirn secuencias a una mquina virtual alojada en el mismo ordenador que el servidor. ABSTRACT In recent years, due to the remarkable development of mobile devices, which have evolved from "simple" phones or players to computers, the amount of services that offer multimedia content over the internet have shot up. Furthermore, the different evolution of these terminals causes that we can find in the market a wide range of different sizes and processing capabilities, making necessary to find a formula that will satisfy the demand for such services regardless of the nature of our device. In order to provide a suitable solution we have chosen to integrate a protocol as RTP and a video standard as SVC. RTP (Real-time Transport Protocol), in opposition to general purpose protocols was designed for real-time applications making it ideal for media streaming. Meanwhile, SVC is a scalable video standard which can transmit a single stream in a base layer and multiple enhancement layers, so that we can adapt the quality and size of the content to the capacity and size of our device. The objective of this project is to integrate and modify both MPlayer and RTP library live555 so that they support the SVC format over RTP protocol and set up a client-server system to check its behavior. Although this process has been designed to be done on a mobile device, for this project we have chosen to do it in the simplest possible scenario so we will stream to a virtual machine hosted on the same computer where we have the server.
Resumo:
El presente proyecto fin de carrera, realizado por el ingeniero tcnico en telecomunicaciones Pedro M. Matamala Lucas, es la fase final de desarrollo de un proyecto de mayor magnitud correspondiente al software de vídeo forense SAVID. El propsito del proyecto en su totalidad es la creacin de una herramienta informtica capacitada para realizar el anlisis de ficheros de vídeo, codificados y comprimidos por el sistema DV Digital Video-. El objetivo del anlisis, es aportar informacin acerca de si la cinta magntica presenta indicios de haber sido manipulada con una edicin posterior a su grabacin original, adems, de mostrar al usuario otros datos de inters como las especificaciones tcnicas de la seal de vídeo y audio. Por lo tanto, se facilitar al usuario, analista de vídeo forense, informacin que le ayude a valorar la originalidad del contenido del soporte que es sujeto del anlisis. El objetivo especfico de esta fase final, es la creacin de la interfaz de usuario del software, que informa tanto del cdigo binario de los sectores significativos, como de su interpretacin tras el anlisis. Tambin permitir al usuario el reporte de los resultados, adems de otras funcionalidades que le permitan la navegacin por los sectores del cdigo que han sido modificados como efecto colateral de la edicin de la cinta magntica original. Otro objetivo importante del proyecto ha sido la investigacin de metodologas y tcnicas de desarrollo de software para su posterior implementacin, buscando con esto, una mayor eficiencia en la gestin del tiempo y una mayor calidad de software con el fin de garantizar su evolucin y sostenibilidad en el futuro. Se ha hecho hincapi en las metodologas giles que han ido ganando relevancia en el sector de las tecnologas de la informacin en las ltimas dcadas, sustituyendo a metodologas clsicas como el desarrollo en cascada. Su flexibilidad durante el ciclo de vida del software, permite obtener mejores resultados cuando las especificaciones no estn del todo definidas, ajustndose de este modo a las condiciones del proyecto. Resumiendo las especificaciones tcnicas del software, C++ es el lenguaje de programacin orientado a objetos con el que se ha desarrollado, utilizndose la tecnologa MFC -Microsoft Foundation Classes- para la implementacin. Es un proyecto MFC de tipo cuadro de dialogo,creado, compilado y publicado, con la herramienta de desarrollo integrado Microsoft Visual Studio 2010. La arquitectura con la que se ha estructurado es la arquetpica de tres capas, compuesta por la interfaz de usuario, capa de negocio y capa de acceso a datos. Se ha visto necesario configurar el proyecto con compatibilidad con CLR Common Languages Runtime- para poder implementar la funcionalidad de creacin de reportes. Acompaando a la aplicacin informtica, se presenta la memoria del proyecto y sus anexos correspondientes a los documentos EDRF Especificaciones Detalladas de Requisitos funcionales-, EIU Especificaciones de Interfaz de Usuario , DT -Diseo Tcnico- y Gua de Usuario. SUMMARY. This dissertation, carried out by the telecommunications engineer Pedro M. Matamala Lucas, is in its final stage and is part of a larger project for the software of forensic video called SAVID. The purpose of the entire project is the creation of a software tool capable of analyzing video files that are coded and compressed by the DV -Digital Video- System. The objective of the analysis is to provide information on whether the magnetic tape shows signs of having been tampered with after the editing of the original recording, and also to show the user other relevant data and technical specifications of the video signal and audio. Therefore the user, forensic video analyst, will have information to help assess the originality of the content of the media that is subject to analysis. The specific objective of this final phase is the creation of the user interface of the software that provides information about the binary code of the significant sectors and also its interpretation after analysis. It will also allow the user to report the results, and other features that will allow browsing through the sections of the code that have been modified as a secondary effect of the original magnetic tape being tampered. Another important objective of the project is the investigation of methodologies and software development techniques to be used in deployment, with the aim of greater efficiency in time management and enhanced software quality in order to ensure its development and maintenance in the future. Agile methodologies, which have become important in the field of information technology in recent decades, have been used during the execution of the project, replacing classical methodologies such as Waterfall Development. The flexibility, as the result of using by agile methodologies, during the software life cycle, produces better results when the specifications are not fully defined, thus conforming to the initial conditions of the project. Summarizing the software technical specifications, C + + the programming language which is object oriented and has been developed using technology MFC- Microsoft Foundation Classes for implementation. It is a project type dialog box, created, compiled and released with the integrated development tool Microsoft Visual Studio 2010. The architecture is structured in three layers: the user interface, business layer and data access layer. It has been necessary to configure the project with the support CLR -Common Languages Runtime in order to implement the reporting functionality. The software application is submitted with the project report and its annexes to the following documents: Functional Requirements Specifications - Detailed User Interface Specifications, Technical Design and User Guide.
Resumo:
En este proyecto se exponen, por un lado, los fundamentos de un nuevo sistema de codificacin de imagen. Este sistema, llamado Logarithmical Hoping Encoding (LHE) codifica cada pxel de la imagen utilizando saltos logartmicos en el dominio del espacio, es decir, trabajando con los valores de luminancia y crominancia de los pxeles, sin necesidad de pasar al dominio de la frecuencia. Adems, se realiza el anlisis de dicho sistema y se ofrecen resultados comparativos con formatos de compresin actuales, tales como JPEG. Por otro lado, se presentan las primeras ideas para el desarrollo de un sistema que permita comprimir vídeo utilizando la tecnologa LHE. As mismo, se muestran los primeros resultados obtenidos y las conclusiones derivadas de los mismos.
Resumo:
Resulta sorprendente la escasa utilizacin que tiene el video como herramienta de representacin arquitectnica. No nos referimos al video divulgativo que se emite en programas culturales, donde los edificios son mostrados con un ritmo lento e imparcial por una cmara que pretende sustituir al posible visitante; sino al video realizado por el propio autor del proyecto. En este caso, el video debera tener un grado de intencin y subjetividad similar al del proyecto que muestra. Su contenido no tendra porque limitarse a imgenes reales, podra combinarlas con imgenes virtuales, animaciones 3D, planos, fotos, etc. Podra ser, incluso, completamente virtual, es decir, emplearse en la presentacin y representacin de proyectos. Asmismo, se echa de menos la utilizacin del video digital basado en el montaje como parte del trabajo de anlisis y crtica arquitectnica. Es decir, su empleo, por parte del crtico, en la interpretacin de la arquitectura y en la bsqueda de las posibles relaciones que se presentan en la misma. En nuestro caso, utilizamos el video como parte de las conclusiones de la tesis doctoral La arquitectura de Mondrian1. El trabajo consista en discriminar entre las obras arquitectnicas realizadas por miembros del grupo De Stijl o de su rbita aqullas que entroncaran con el elaborado discurso terico de Mondrian. Nuestro inters se centr en buscar en la arquitectura moderna ejemplos en los que pudiramos encontrar paralelismos fundamentales (de fondo) entre determinados edificios y la teora de las artes de Mondrian. Para ello el video se mostr como una herramienta capaz de ilustrar y enfatizar, de forma intuitiva y grfica, las conclusiones del trabajo.
Resumo:
Entre los recursos susceptibles de ser utilizados en red, desarrollados por el grupo de Innovacin Educativa INNGEO, cabe destacar la produccin de 13 vídeos que constituyen un valioso material para facilitar las Observaciones de campo en asignaturas de la materia Topografa del Grado en Ingeniera Geomtica y Topografa; son, en la prctica, la versin audiovisual de los Cuadernos de observaciones de campo, tan enraizados en el saber hacer de las materias especficas de la titulacin objeto de innovacin. Con el objetivo principal de hacer del vídeo docente un recurso facilitador del aprendizaje/autoaprendizaje, se presenta, no solo la metodologa, tcnicas y tecnologas utilizadas en su diseo y produccin, sino tambin el impacto que en asignaturas, Escuela, UPM y mundo tcnico ha generado desde su incorporacin como recurso innovador en asignaturas implementadas en Moodle, hasta su publicacin en abierto en el Canal UPM de YouTube y en iTunes U. Abstract: Among the resources that could be used in a network, developed by the Educational Innovation INNGEO group included the production of 13 videos that provide va luable material for facilitating field observations in subjects of the matter "Topography" of the Engineering Degree in Geomatics and Surveying; They are, in practice, "visual version" of the Journal of field observations, as rooted in the "know how to do" of the specific subjects of the degree object of innovation. With the aim of making the educational video a resource facilitator of learning / self - study is presented, not only the methodology, techniques and technologies used in design and production, but also the impact on subjects, School, UPM and technical world has generated from its incorporation as a resource implemented innovative courses Moodle, until its open publication in the UPM Channel in YouTube and iTunes U.
Resumo:
Aunque esta no es la primera vez que nuevas compaas y tecnologas revolucionan la forma de entender una industria determinada, los modelos over-the-top (OTT) han provocado una explosin en el consumo de contenidos a travs de internet, una revolucin en la forma tradicional de comunicarse, de disfrutar de nuevas posibilidades de ocio digital y, por tanto, una transformacin a la hora de entender los modelos de monetizacin de las compaas, actualmente buscando su lugar en la nueva cadena de valor. Ya no cabe duda de que este tipo de servicios se han hecho un hueco en la rutina diaria de las personas pero, a pesar de su rpida adopcin y alta tasa de penetracin, todo parece indicar que es slo el comienzo de una nueva era, donde estos nuevos modelos disruptivos, estn todava por definirse. Tras unos aos de cambios en el sector de las comunicaciones y entretenimiento digital, es ahora el del consumo audiovisual de entretenimiento el que se est viviendo sus debates ms intensos. Este trabajo, presentado como proyecto final dentro del Mster de Consultora en Gestin de Empresas fruto de la colaboracin entre la UPM y la AEC, analiza en profundidad los cambios que est generando la adopcin de soluciones de vídeo-OTT en el mercado a todos los niveles: cambios en los patrones de comportamiento de las personas, impactos en los sectores tradicionales (y su traduccin en trminos econmicos y legales), evolucin de la tecnologa, etc. Todos estos aspectos se visitan haciendo especial hincapi en la cadena de valor y los nuevos modelos de negocio derivados de estas nuevas soluciones permitiendo monetizar estos cambios en un mercado complejo. Como complemento, se presenta un anlisis de una de las soluciones lderes en el mercado, NETFLIX. Profundizar en un modelo de negocio de una compaa como esta permite analizar las estrategias seguidas y resultados obtenidos en funcin de la caracterizacin del mercado existente en cada momento, tomando notas para tener en cuenta en el planteamiento de modelos de negocio similares. Adicionalmente, en el apartado de recomendaciones para la cadena de valor, se establecen una serie de modelos de negocio que permitan enfrentar la aparicin y crecimiento de los servicios OTT desde dos puntos de vista: diferenciacin y participacin de los mismos. Las aportaciones de valor presentadas, prestan especial atencin tambin sobre las operadoras de telecomunicaciones, uno de los sectores ms castigados por la entrada en el mercado de las soluciones de vídeo-OTT, junto con la televisin de pago. Por ltimo, se utilizan todas las conclusiones extradas de los anteriores apartados (que sirven como caracterizacin de entorno) para establecer un plan de negocio definiendo una propuesta que podra ser interesante desarrollar en el mercado espaol, carente actualmente de una solucin lder que destaque, como ocurre en otros pases. En base a este trabajo, se puede concluir que este tipo de servicios de vídeo-OTT presentan un potencial todava por desarrollar y que conviene incluir en las estrategias de los prximos aos de las compaas del sector, si stas no quieren perder cuota de un mercado que sin duda evolucionar y revolucionar el mundo de la televisin tal y como existe actualmente.
Resumo:
En las ultimas dcadas hemos sufrido un gran cambio en el modo, como en la calidad de Vida en el cual se debe a gran medida al avance tan grande que ha habido en el mundo tecnolgico. Alguno de estos avances y en el cual tratara el proyecto son la codificaciones y formato de video. En las dcadas que llevamos de televisin en color hay dos formatos de video en los cuales han destacado sobre el resto uno que es el sistema de codificacin analgico PAL ,que es el sistema de televisin Analgica que se utilizaba en toda Europa (Exceptuando Francia) y en la mayora de la poblacin mundial. Por otro lado tenemos el otro sistema de video que es el HD aunque el proyecto lleva 40 aos existiendo he tomado una mayor importancia ahora con el cambio que se ha habido de pasar de una televisin analgica a una televisin digital. En este proyecto se creara una herramienta capaz de transformar un video en Formato PAL que es un formato que tiene 720 pixeles de longitud y 576 pixeles de altura al formato de video HD que en su caso tiene las dimensiones 1920x 1080 pixeles de longitud y altura respectivamente.
Resumo:
La introduccin de las cirugas de mnima invasin en rutina clnica ha provocado la incorporacin de los sistemas de vídeo dentro del quirfano. As, estas tcnicas proporcionan al cirujano imgenes que antes solo podan ser vistas mediante ciruga abierta. Los vídeos obtenidos en las intervenciones son almacenados en repositorios. El uso posterior de estos vídeos se ve limitado generalmente a su reproduccin, debido a las dificultades de clasificacin y gestin. La informacin que contienen estos repositorios puede ser explotada, reutilizando el conocimiento obtenido en cirugas similares. En este artculo de investigacin se presenta el diseo de un mdulo de gestin de conocimiento (MGC) para un repositorio de vídeos de ciruga de mnima invasin (CMI). El objetivo del mdulo es gestionar y reutilizar la informacin contenida en el repositorio de vídeos laparoscpicos, para que puedan ser utilizadas con las experiencias previas en entornos de formacin de nuevos cirujanos. Para este fin, se han implementado tcnicas de recuperacin de imagen y vídeo basadas en sus contenidos visuales (CBIR y CBVR). El MGC permite la recuperacin de imgenes/vídeos, proporcionando informacin sobre la tarea que se est realizando en la escena quirrgica. Los resultados obtenidos en este trabajo muestran la posibilidad de recuperar vídeos de CMI, a partir del instrumental presente en la escena quirrgica.
Resumo:
Este proyecto fn de carrera describe el desarrollo de un sistema de estimacin de mapas de profundidad densos a partir de secuencias reales de vídeo 3D. Est motivado por la necesidad de utilizar la informacin de profundidad de un vídeo estreo para calcular las oclusiones en el mdulo de insercin de objetos sintticos interactivos desarrollado en el proyecto ImmersiveTV. En el receptor 3DTV, el sistema debe procesar en tiempo real secuencias estreo de escenas reales en alta resolucin con formato Side-by-Side. Se analizan las caractersticas del contenido para conocer los problemas a enfrentar. Obtener un mapa de profundidad denso mediante correspondencia estreo (stereo matching) permite calcular las oclusiones del objeto sinttico con la escena. No es necesario que el valor de disparidad asignado a cada pxel sea preciso, basta con distinguir los distintos planos de profundidad ya que se trabaja con distancias relativas. La correspondencia estreo exige que las dos vistas de entrada estn alineadas. Primero se comprueba si se deben rectificar y se realiza un repaso terico de calibracin y rectificacin, resumiendo algunos mtodos a considerar en la resolucin del problema. Para estimar la profundidad, se revisan tcnicas de correspondencia estreo densa habituales, seleccionando un conjunto de implementaciones con el fin de valorar cules son adecuadas para resolver el problema, incluyendo tcnicas locales, globales y semiglobales, algunas sobre CPU y otras para GPU; modificando algunas para soportar valores negativos de disparidad. No disponer de ground truth de los mapas de disparidad del contenido real supone un reto que obliga a buscar mtodos indirectos de comparacin de resultados. Para una evaluacin objetiva, se han revisado trabajos relacionados con la comparacin de tcnicas de correspondencia y entornos de evaluacin existentes. Se considera el mapa de disparidad como error de prediccin entre vistas desplazadas. A partir de la vista derecha y la disparidad de cada pxel, puede reconstruirse la vista izquierda y, comparando la imagen reconstruida con la original, se calculan estadsticas de error y las tasas de pxeles con disparidad invlida y errnea. Adems, hay que tener en cuenta la eficiencia de los algoritmos midiendo la tasa de cuadros por segundo que pueden procesar. Observando los resultados, atendiendo a los criterios de maximizacin de PSNR y minimizacin de la tasa de pxeles incorrectos, se puede elegir el algoritmo con mejor comportamiento. Como resultado, se ha implementado una herramienta que integra el sistema de estimacin de mapas de disparidad y la utilidad de evaluacin de resultados. Trabaja sobre una imagen, una secuencia o un vídeo estereoscpico. Para realizar la correspondencia, permite escoger entre un conjunto de algoritmos que han sido adaptados o modificados para soportar valores negativos de disparidad. Para la evaluacin, se ha implementado la reconstruccin de la vista de referencia y la comparacin con la original mediante el clculo de la RMS y PSNR, como medidas de error, adems de las tasas de pxeles invlidos e incorrectos y de la eficiencia en cuadros por segundo. Finalmente, se puede guardar las imgenes (o vídeos) generados como resultado, junto con un archivo de texto en formato csv con las estadsticas para su posterior comparacin.
Resumo:
En los ltimos aos el consumo de servicios de vídeo se ha incrementado de forma notable y se espera que dicha tendencia contine en los prximos aos. Los servicios de streaming de vídeo Over-The-Top (OTT), en los que se centra esta tesis, constituyen uno de los principales motores de dicho crecimiento. A diferencia de los servicios Internet Protocol Television (IPTV), que utilizan una red controlada en la que se pueden implementar mecanismos de Quality of Service (QoS), los servicios de streaming de vídeo OTT se prestan sobre Internet, por lo que llevan asociados interesantes desafos desde un punto de vista tcnico. Uno de los mayores desafos tcnicos a los que se enfrentan los servicios de streaming de vídeo OTT es mantener un nivel de Quality of Experience (QoE) que satisfaga a sus usuarios, por lo que es necesario contar con tcnicas y herramientas que permitan monitorizar la calidad percibida por los usuarios de estos servicios. El streaming de vídeo OTT supone un cambio de filosofa en comparacin con otras tcnicas de streaming ms tradicionales como RTP/RTSP. Los servicios de vídeo OTT suelen seguir el paradigma Dynamic Adaptive Streaming over HTTP (DASH), que se basa en sustituir los servidores de streaming tradicionales por servidores web que ponen a disposicin de los clientes los contenidos de vídeo codificados en varias versiones con distinto nivel de calidad. Cada una de estas versiones o representaciones est dividida en pequeos fragmentos o segmentos que los clientes pueden solicitar mediante el protocolo HTTP. Los clientes pueden solicitar diferentes niveles de calidad en funcin de los parmetros que consideren ms adecuados (ancho de banda de la red, resolucin de pantalla, tipo de cdec, etc.), lo que les permite adaptarse a condiciones cambiantes del entorno. Como se puede ver, el paradigma DASH ha trasladado el control de la sesin del servidor al cliente y ha sustituido los servidores de streaming por servidores web que simplemente sirven los segmentos de vídeo que los clientes solicitan. Adems se esta simplificacin de los servidores de streaming, existen otras ventajas asociadas a DASH, como son la utilizacin de Content Delivery Network (CDN), la compatibilidad con NATs y firewalls, etc. En esta tesis doctoral se lleva a cabo la propuesta de un conjunto de modelos cuyo objetivo es estimar la calidad percibida por los usuarios de los servicios de vídeo basados en DASH. Ms concretamente, partiendo de la definicin del servicio como un conjunto de componentes de servicio, se desarrollan modelos parciales que estiman la calidad percibida asociada a cada uno de estos componentes: calidad de vídeo, calidad de audio, degradaciones asociadas a la transmisin, etc. Cada una de estas estimaciones de calidad percibida se combinan en un modelo global que estima la calidad percibida total del servicio.
Resumo:
Este Trabajo de Fin de Grado consiste en el anlisis, evaluacin y mejora de un sistema de segmentacin temporal de vídeo, embebido dentro de un programa de caracterizacin esttica de vídeos que detecta cambios de plano a travs de cortes, fundidos y encadenados. En primer lugar se realiza un anlisis del programa original empleando mtricas que permitan cuantificar el rendimiento y detectar los principales problemas y su contexto, buscando patrones comunes que permitan enfocar las mejoras necesarias para solventar dichos problemas. A continuacin, se proponen mejoras tanto funcionales como no funcionales, que son acometidas en la fase de diseo e implementacin. Para las mejoras relacionadas con la segmentacin temporal, se aplican tcnicas existentes en el estado del arte y se adaptan a las necesidades del programa. Finalmente, se evala el programa comprobando que las mtricas que haban cuantificado los problemas han mejorado y detallando el posible trabajo futuro a realizar sobre el programa.