34 resultados para visual object categorization
Resumo:
Vishnu is a tool for XSLT visual programming in Eclipse - a popular and extensible integrated development environment. Rather than writing the XSLT transformations, the programmer loads or edits two document instances, a source document and its corresponding target document, and pairs texts between then by drawing lines over the documents. This form of XSLT programming is intended for simple transformations between related document types, such as HTML formatting or conversion among similar formats. Complex XSLT programs involving, for instance, recursive templates or second order transformations are out of the scope of Vishnu. We present the architecture of Vishnu composed by a graphical editor and a programming engine. The editor is an Eclipse plug-in where the programmer loads and edits document examples and pairs their content using graphical primitives. The programming engine receives the data collected by the editor and produces an XSLT program. The design of the engine and the process of creation of an XSLT program from examples are also detailed. It starts with the generation of an initial transformation that maps source document to the target document. This transformation is fed to a rewrite process where each step produces a refined version of the transformation. Finally, the transformation is simplified before being presented to the programmer for further editing.
Resumo:
Os sistemas de perceção existentes nos robôs autónomos, hoje em dia, são bastante complexos. A informação dos vários sensores, existentes em diferentes partes do robôs, necessitam de estar relacionados entre si face ao referencial do robô ou do mundo. Para isso, o conhecimento da atitude (posição e rotação) entre os referenciais dos sensores e o referencial do robô é um fator critico para o desempenho do mesmo. O processo de calibração dessas posições e translações é chamado calibração dos parâmetros extrínsecos. Esta dissertação propõe o desenvolvimento de um método de calibração autónomo para robôs como câmaras direcionais, como é o caso dos robôs da equipa ISePorto. A solução proposta consiste na aquisição de dados da visão, giroscópio e odometria durante uma manobra efetuada pelo robô em torno de um alvo com um padrão conhecido. Esta informação é então processada em conjunto através de um Extended Kalman Filter (EKF) onde são estimados necessários para relacionar os sensores existentes no robô em relação ao referencial do mesmo. Esta solução foi avaliada com recurso a vários testes e os resultados obtidos foram bastante similares aos obtidos pelo método manual, anteriormente utilizado, com um aumento significativo em rapidez e consistência.
Resumo:
Trabalho de natureza profissional para a atribuição do Título de Especialista do Instituto Politécnico do Porto, na área de Design, defendido a 23-02-2015.
Resumo:
Este trabalho foi realizado no âmbito do Mestrado em Engenharia Mecânica, especialização em Gestão Industrial, do Instituto Superior de Engenharia do Porto. O estudo foi desenvolvido na Continental Mabor – Indústria de Pneus S.A., sendo analisado o processo de Inspeção Visual dos pneus. Face à atual conjuntura de mercado, as empresas devem estar munidas de dados detalhados e precisos relativos aos seus processos produtivos. A Capacidade instalada apresenta-secomo um parâmetro determinante na medida em que condiciona diretamente a resposta a solicitações de clientes. Esta é fortemente influenciada pelo Layout fabril, pelo que a otimização do mesmo é fundamental numa perspetiva de ganho de Capacidade produtiva. O relatório iniciou-se com a determinação do Tempo Previsto da operação segundo o referencial REFA. Seguidamente quantificaram-se as atuais perturbações através de auditorias ao processo. Deste modo obteve-se uma Capacidade instalada de 59380 pneus/dia. A análise das perturbações desenvolveu-se a partir de um diagrama causa-efeito, no qual foram identificadas diversas potenciais causas, classificadas posteriormente por uma equipa experiente e conhecedora do processo. Assim, conhecidas as perturbações de maior impacto, foi apresentada uma solução de Layout que visou a sua minimização. O ganho estimado, em termos de Capacidade, após a implementação da solução proposta é de 3000 pneus/dia. Este ganho de 5% é significativo na medida em que é obtido sem a necessidade de aquisição de novos equipamentos nem de área fabril adicional. É expectável que esta implementação proporcione ainda melhorias no processo produtivo subsequente - Uniformidade, especificamente na alimentação do mesmo. A quantificação desta melhoria, na sequência deste trabalho, apresenta-se como uma oportunidade de estudo futuro.
Resumo:
International Conference on Intelligent Sensors, Sensor Networks and Information Processing (ISSNIP 2015). 7 to 9, Apr, 2015. Singapure, Singapore.
Resumo:
This work presents a hybrid coordinated manoeuvre for docking an autonomous surface vehicle with an autonomous underwater vehicle. The control manoeuvre uses visual information to estimate the AUV relative position and attitude in relation to the ASV and steers the ASV in order to dock with the AUV. The AUV is assumed to be at surface with only a small fraction of its volume visible. The system implemented in the autonomous surface vehicle ROAZ, developed by LSA-ISEP to perform missions in river environment, test autonomous AUV docking capabilities and multiple AUV/ASV coordinated missions is presented. Information from a low cost embedded robotics vision system (LSAVision), along with inertial navigation sensors is fused in an extended Kalman filter and used to determine AUV relative position and orientation to the surface vehicle The real time vision processing system is described and results are presented in operational scenario.
Resumo:
Aprender a ler é um dos maiores desafios que as crianças enfrentam quando entram para a escola. A dificuldade no domínio do código alfabético, nos níveis da consciência fonológica e a falta de fluência na leitura são fatores que interferem em larga escala na aprendizagem global dos alunos. Habilitar um aluno para a prática da leitura é um estímulo que tem vindo a dar origem a várias investigações e intervenções no campo da educação. Este projeto descreve dois programas de treino: “Programa de treino da percepção Visual” e “Programa de promoção do desenvolvimento da consciência fonológica”, num aluno do 2º ciclo do ensino básico com dificuldade de fluência na leitura, ao longo de quinze aulas de 90 minutos. No que respeita aos resultados do primeiro estudo, que teve por base o “Programa de treino da percepção visual”, não foram encontradas diferenças relevantes quanto ao seu efeito na fluência da leitura do aluno. No entanto, no segundo estudo, que se centrou na aplicação do “Programa de promoção do desenvolvimento da consciência fonológica” em complemento com o “Programa de treino da percepção visual”, mostrou que o aluno ficou mais fluente na leitura diminuindo o número de erros de precisão (substituições, omissões, inversões, adições e erros complexos). Assim, sugere-se uma monotorização sistemática das aprendizagens dos alunos para que as intervenções possam ser cada vez mais precoces e direcionadas para as suas necessidades.
Resumo:
The underground scenarios are one of the most challenging environments for accurate and precise 3d mapping where hostile conditions like absence of Global Positioning Systems, extreme lighting variations and geometrically smooth surfaces may be expected. So far, the state-of-the-art methods in underground modelling remain restricted to environments in which pronounced geometric features are abundant. This limitation is a consequence of the scan matching algorithms used to solve the localization and registration problems. This paper contributes to the expansion of the modelling capabilities to structures characterized by uniform geometry and smooth surfaces, as is the case of road and train tunnels. To achieve that, we combine some state of the art techniques from mobile robotics, and propose a method for 6DOF platform positioning in such scenarios, that is latter used for the environment modelling. A visual monocular Simultaneous Localization and Mapping (MonoSLAM) approach based on the Extended Kalman Filter (EKF), complemented by the introduction of inertial measurements in the prediction step, allows our system to localize himself over long distances, using exclusively sensors carried on board a mobile platform. By feeding the Extended Kalman Filter with inertial data we were able to overcome the major problem related with MonoSLAM implementations, known as scale factor ambiguity. Despite extreme lighting variations, reliable visual features were extracted through the SIFT algorithm, and inserted directly in the EKF mechanism according to the Inverse Depth Parametrization. Through the 1-Point RANSAC (Random Sample Consensus) wrong frame-to-frame feature matches were rejected. The developed method was tested based on a dataset acquired inside a road tunnel and the navigation results compared with a ground truth obtained by post-processing a high grade Inertial Navigation System and L1/L2 RTK-GPS measurements acquired outside the tunnel. Results from the localization strategy are presented and analyzed.
Resumo:
13th International Conference on Autonomous Robot Systems (Robotica), 2013, Lisboa
Resumo:
Proceedings of the International Conference on Computer Vision Theory and Applications, 361-365, 2013, Barcelona, Spain
Resumo:
The robotics community is concerned with the ability to infer and compare the results from researchers in areas such as vision perception and multi-robot cooperative behavior. To accomplish that task, this paper proposes a real-time indoor visual ground truth system capable of providing accuracy with at least more magnitude than the precision of the algorithm to be evaluated. A multi-camera architecture is proposed under the ROS (Robot Operating System) framework to estimate the 3D position of objects and the implementation and results were contextualized to the Robocup Middle Size League scenario.
Resumo:
This work presents an automatic calibration method for a vision based external underwater ground-truth positioning system. These systems are a relevant tool in benchmarking and assessing the quality of research in underwater robotics applications. A stereo vision system can in suitable environments such as test tanks or in clear water conditions provide accurate position with low cost and flexible operation. In this work we present a two step extrinsic camera parameter calibration procedure in order to reduce the setup time and provide accurate results. The proposed method uses a planar homography decomposition in order to determine the relative camera poses and the determination of vanishing points of detected lines in the image to obtain the global pose of the stereo rig in the reference frame. This method was applied to our external vision based ground-truth at the INESC TEC/Robotics test tank. Results are presented in comparison with an precise calibration performed using points obtained from an accurate 3D LIDAR modelling of the environment.
Resumo:
We present a novel approach of Stereo Visual Odometry for vehicles equipped with calibrated stereo cameras. We combine a dense probabilistic 5D egomotion estimation method with a sparse keypoint based stereo approach to provide high quality estimates of vehicle’s angular and linear velocities. To validate our approach, we perform two sets of experiments with a well known benchmarking dataset. First, we assess the quality of the raw velocity estimates in comparison to classical pose estimation algorithms. Second, we added to our method’s instantaneous velocity estimates a Kalman Filter and compare its performance with a well known open source stereo Visual Odometry library. The presented results compare favorably with state-of-the-art approaches, mainly in the estimation of the angular velocities, where significant improvements are achieved.