5 resultados para Kinect simulink UDP C gesture UAV
em Universidad Politécnica de Madrid
Resumo:
El dispositivo Microsoft Kinect for Windows y similares, han introducido en el mundo del PC una nueva forma de interaccin denominada Touchless Gesture User Interface o TGUI (Interfaz de Usuario por Gestos sin Contacto) [Gentile et al. 2011]. Se trata de una tecnologa novedosa en proceso de evolucin. La tecnologa de Kinect detecta la presencia de un usuario y monitoriza la posicin en el espacio de sus articulaciones principales. Esta informacin permite desarrollar aplicaciones que posibiliten interactuar al usuario con una computadora mediante gestos y sin la necesidad de estar en contacto con perifrico alguno. Desde la invencin del perifrico ratn en los aos 60, resulta curioso que con la frentica evolucin que ha experimentado el mundo de la informtica en todos estos aos, este dispositivo no haya sufrido cambios significativos o no haya sido incluso sustituido por otro perifrico. En este proyecto se ha abordado el reto de desarrollar un controlador de ratn gestual para Windows utilizando Microsoft Kinect, de tal forma que se sustituya el uso del tpico ratn y sea el propio usuario el que acte como controlador mediante gestos y movimientos de sus manos. El resultado es llamativo y aporta numerosas mejoras y novedades frente a aplicaciones similares, aunque deja en evidencia algunas de las limitaciones de la tecnologa implementada por Kinect a da de hoy. Es de esperar que cuando evolucione su tecnologa, su uso se convierta en cotidiano.
Resumo:
New forms of natural interactions between human operators and UAVs (Unmanned Aerial Vehicle) are demanded by the military industry to achieve a better balance of the UAV control and the burden of the human operator. In this work, a human machine interface (HMI) based on a novel gesture recognition system using depth imagery is proposed for the control of UAVs. Hand gesture recognition based on depth imagery is a promising approach for HMIs because it is more intuitive, natural, and non-intrusive than other alternatives using complex controllers. The proposed system is based on a Support Vector Machine (SVM) classifier that uses spatio-temporal depth descriptors as input features. The designed descriptor is based on a variation of the Local Binary Pattern (LBP) technique to efficiently work with depth video sequences. Other major consideration is the especial hand sign language used for the UAV control. A tradeoff between the use of natural hand signs and the minimization of the inter-sign interference has been established. Promising results have been achieved in a depth based database of hand gestures especially developed for the validation of the proposed system.
Resumo:
La rpida evolucin de tecnologas que mejoran la interaccin con los ordenadores ha cambiado la forma de pensar de la sociedad actual. Una de las ltimas alternativas se centra en el reconocimiento facial y de gestos, el cual ha dado muy buenos resultados, acercando ordenadores y humanos. El objetivo de este proyecto era desarrollar un prototipo que permita el reconocimiento de gestos mediante el dispositivo Kinect, el cual usa una de las tecnologas mencionadas anteriormente. Para la realizacin de este prototipo, fue necesario el estudio del funcionamiento de Kinect. Una vez realizado, el siguiente paso consisti en la bsqueda de libreras que facilitaran el reconocimiento de gestos, para compararlas y finalmente escoger una de ellas. Al ser una tecnologa reciente, no existen demasiadas aplicaciones que utilicen Kinect y por lo tanto, la bsqueda de la librera era una parte fundamental del proyecto. Tras elegir la librera, se analizaron las caractersticas que deba tener el prototipo para realizar el diseo del mismo. Este diseo se realiz de forma iterativa y con numerosos cambios para otorgar al prototipo la mayor abstraccin posible y una mayor orientacin a objetos, para de esta manera, favorecer los posibles cambios que sean necesarios al ser una tecnologa nueva y muy cambiante. Finalmente, el paso final fue la implementacin del prototipo bajo el diseo propuesto, consiguiendo un prototipo funcional capaz de reconocer, almacenar, mostrar y definir diferentes gestos. Los resultados ofrecidos por Kinect son muy satisfactorios, con una gran precisin y eficiencia, demostrando el potencial de las nuevas tecnologas de interaccin sin contacto, cuyo nico defecto se encuentra en ser una tecnologa poco madura y en evolucin. ---------------------------------------------------------------------------------------------------------- The fast development of technologies that enhance interaction with computers has changed the mindset of the society. One of the latest alternatives focuses on face and gesture recognition, which has been very successful, bringing closer computers and humans. The purpose of this project was to develop a gesture recognition prototype with the Kinect device, which uses one of the technologies mentioned above. For the realization of this prototype, it was necessary to study how Kinect works. Once done, the next step was to search for libraries to facilitate the gesture recognition, to compare them and finally choose one of them. Because it is a recent technology, there are not many applications that use Kinect and therefore, the library search was an essential part of the project. After selecting the library, the characteristics that the prototype should have were analyzed for the design. This design was performed iteratively with numerous changes to give the prototype abstraction and object orientation, because as a new technology, it changes fast. Therefore, with this design it would be easier to deal with possible changes. Finally, the final step was the implementation of the prototype under the proposed design, getting a functional prototype able to recognize, store, display and define different gestures. The results offered by Kinect are very satisfactory, with high accuracy and efficiency, demonstrating the potential of the new interaction technologies without contact, whose only fault is to be a little mature technology and evolving.
Resumo:
Este trabajo esta orientado a resolver el problema de la caracterizacin de la copa de arboles frutales para la aplicacion localizada de fitosanitarios. Esta propuesta utiliza un mapa de profundidad (Depth image) y una imagen RGB combinadas (RGB-D), proporcionados por el sensor Kinect de Microsoft, para aplicar pesticidas de forma localizada. A travs del mapa de profundidad se puede estimar la densidad de la copa y a partir de esta informacin determinar qu boquillas se deben abrir en cada momento. Se desarrollaron algoritmos implementados en Matlab que permiten adems de la adquisicin de las imgenes RGB-D, aplicar plaguicidas slo a hojas y/o frutos segn se desee. Estos algoritmos fueron implementados en un software que se comunica con el entorno de desarrollo "Kinect Windows SDK", encargado de extraer las imgenes desde el sensor Kinect. Por otra parte, para identificar hojas, se implementaron algoritmos de clasificacin e identificacin. Los algoritmos de clasificacin utilizados fueron "Fuzzy C-Means con Gustafson Kessel" (FCM-GK) y "K-Means". Los centroides o prototipos de cada clase generados por FCM-GK fueron usados como semilla para K-Means, para acelerar la convergencia del algoritmo y mantener la coherencia temporal en los grupos generados por K-Means. Los algoritmos de clasificacin fueron aplicados sobre las imgenes transformadas al espacio de color L*a*b*; especficamente se emplearon los canales a*, b* (canales cromticos) con el fin de reducir el efecto de la luz sobre los colores. Los algoritmos de clasificacin fueron configurados para buscar cuatro grupos: hojas, porosidad, frutas y tronco. Una vez que el clasificador genera los prototipos de los grupos, un clasificador denominado Mquina de Soporte Vectorial, que utiliza como ncleo una funcin Gaussiana base radial, identifica la clase de inters (hojas). La combinacin de estos algoritmos ha mostrado bajos errores de clasificacin, rendimiento del 4% de error en la identificacin de hojas. Adems, estos algoritmos de procesamiento de hasta 8.4 imgenes por segundo, lo que permite su aplicacin en tiempo real. Los resultados demuestran la viabilidad de utilizar el sensor "Kinect" para determinar dnde y cundo aplicar pesticidas. Por otra parte, tambin muestran que existen limitaciones en su uso, impuesta por las condiciones de luz. En otras palabras, es posible usar "Kinect" en exteriores, pero durante das nublados, temprano en la maana o en la noche con iluminacin artificial, o aadiendo un parasol en condiciones de luz intensa.
Resumo:
The interest in missions with multiple Unmanned Aerial Vehicles (UAVs) has increased significantly in last years. These missions take advantage of the use of fleets instead of single UAVs to ensure the success, reduce the duration or increase the goals of the mission. In addition, they allow performing tasks that require multiple agents and certain coordination (e.g. surveillance of large areas or transport of heavy loads). Nevertheless, these missions suppose a challenge in terms of control and monitoring. In fact, the workload of the operators rises with the utilization of multiple UAVs and payloads, since they have to analyze more information, make more decisions and generate more commands during the mission. This work addresses the operator workload problem in multi-UAV missions by reducing and selecting the information. Two approaches are considered: a first one that selects the information according to the mission state, and a second one that selects it according to the operator preferences. The result is an interface that is able to control the amount of information and show what is relevant for mission and operator at the time.