43 resultados para Visual Speaker Recognition, Visual Speech Recognition, Cascading Appearance-Based Features


Relevância:

40.00% 40.00%

Publicador:

Resumo:

Aprender a ler é um dos maiores desafios que as crianças enfrentam quando entram para a escola. A dificuldade no domínio do código alfabético, nos níveis da consciência fonológica e a falta de fluência na leitura são fatores que interferem em larga escala na aprendizagem global dos alunos. Habilitar um aluno para a prática da leitura é um estímulo que tem vindo a dar origem a várias investigações e intervenções no campo da educação. Este projeto descreve dois programas de treino: “Programa de treino da percepção Visual” e “Programa de promoção do desenvolvimento da consciência fonológica”, num aluno do 2º ciclo do ensino básico com dificuldade de fluência na leitura, ao longo de quinze aulas de 90 minutos. No que respeita aos resultados do primeiro estudo, que teve por base o “Programa de treino da percepção visual”, não foram encontradas diferenças relevantes quanto ao seu efeito na fluência da leitura do aluno. No entanto, no segundo estudo, que se centrou na aplicação do “Programa de promoção do desenvolvimento da consciência fonológica” em complemento com o “Programa de treino da percepção visual”, mostrou que o aluno ficou mais fluente na leitura diminuindo o número de erros de precisão (substituições, omissões, inversões, adições e erros complexos). Assim, sugere-se uma monotorização sistemática das aprendizagens dos alunos para que as intervenções possam ser cada vez mais precoces e direcionadas para as suas necessidades.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

The underground scenarios are one of the most challenging environments for accurate and precise 3d mapping where hostile conditions like absence of Global Positioning Systems, extreme lighting variations and geometrically smooth surfaces may be expected. So far, the state-of-the-art methods in underground modelling remain restricted to environments in which pronounced geometric features are abundant. This limitation is a consequence of the scan matching algorithms used to solve the localization and registration problems. This paper contributes to the expansion of the modelling capabilities to structures characterized by uniform geometry and smooth surfaces, as is the case of road and train tunnels. To achieve that, we combine some state of the art techniques from mobile robotics, and propose a method for 6DOF platform positioning in such scenarios, that is latter used for the environment modelling. A visual monocular Simultaneous Localization and Mapping (MonoSLAM) approach based on the Extended Kalman Filter (EKF), complemented by the introduction of inertial measurements in the prediction step, allows our system to localize himself over long distances, using exclusively sensors carried on board a mobile platform. By feeding the Extended Kalman Filter with inertial data we were able to overcome the major problem related with MonoSLAM implementations, known as scale factor ambiguity. Despite extreme lighting variations, reliable visual features were extracted through the SIFT algorithm, and inserted directly in the EKF mechanism according to the Inverse Depth Parametrization. Through the 1-Point RANSAC (Random Sample Consensus) wrong frame-to-frame feature matches were rejected. The developed method was tested based on a dataset acquired inside a road tunnel and the navigation results compared with a ground truth obtained by post-processing a high grade Inertial Navigation System and L1/L2 RTK-GPS measurements acquired outside the tunnel. Results from the localization strategy are presented and analyzed.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

13th International Conference on Autonomous Robot Systems (Robotica), 2013, Lisboa

Relevância:

40.00% 40.00%

Publicador:

Resumo:

Proceedings of the International Conference on Computer Vision Theory and Applications, 361-365, 2013, Barcelona, Spain

Relevância:

40.00% 40.00%

Publicador:

Resumo:

This work presents an automatic calibration method for a vision based external underwater ground-truth positioning system. These systems are a relevant tool in benchmarking and assessing the quality of research in underwater robotics applications. A stereo vision system can in suitable environments such as test tanks or in clear water conditions provide accurate position with low cost and flexible operation. In this work we present a two step extrinsic camera parameter calibration procedure in order to reduce the setup time and provide accurate results. The proposed method uses a planar homography decomposition in order to determine the relative camera poses and the determination of vanishing points of detected lines in the image to obtain the global pose of the stereo rig in the reference frame. This method was applied to our external vision based ground-truth at the INESC TEC/Robotics test tank. Results are presented in comparison with an precise calibration performed using points obtained from an accurate 3D LIDAR modelling of the environment.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

We present a novel approach of Stereo Visual Odometry for vehicles equipped with calibrated stereo cameras. We combine a dense probabilistic 5D egomotion estimation method with a sparse keypoint based stereo approach to provide high quality estimates of vehicle’s angular and linear velocities. To validate our approach, we perform two sets of experiments with a well known benchmarking dataset. First, we assess the quality of the raw velocity estimates in comparison to classical pose estimation algorithms. Second, we added to our method’s instantaneous velocity estimates a Kalman Filter and compare its performance with a well known open source stereo Visual Odometry library. The presented results compare favorably with state-of-the-art approaches, mainly in the estimation of the angular velocities, where significant improvements are achieved.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

As novas tecnologias aplicadas ao processamento de imagem e reconhecimento de padrões têm sido alvo de um grande progresso nas últimas décadas. A sua aplicação é transversal a diversas áreas da ciência, nomeadamente a área da balística forense. O estudo de evidências (invólucros e projeteis) encontradas numa cena de crime, recorrendo a técnicas de processamento e análise de imagem, é pertinente pelo facto de, aquando do disparo, as armas de fogo imprimirem marcas únicas nos invólucros e projéteis deflagrados, permitindo relacionar evidências deflagradas pela mesma arma. A comparação manual de evidências encontradas numa cena de crime com evidências presentes numa base de dados, em termos de parâmetros visuais, constitui uma abordagem demorada. No âmbito deste trabalho pretendeu-se desenvolver técnicas automáticas de processamento e análise de imagens de evidências, obtidas através do microscópio ótico de comparação, tendo por base algoritmos computacionais. Estes foram desenvolvidos com recurso a pacotes de bibliotecas e a ferramentas open-source. Para a aquisição das imagens de evidências balísticas foram definidas quatro modalidades de aquisição: modalidade Planar, Multifocus, Microscan e Multiscan. As imagens obtidas foram aplicados algoritmos de processamento especialmente desenvolvidos para o efeito. A aplicação dos algoritmos de processamento permite a segmentação de imagem, a extração de características e o alinhamento de imagem. Este último tem como finalidade correlacionar as evidências e obter um valor quantitativo (métrica), indicando o quão similar essas evidências são. Com base no trabalho desenvolvido e nos resultados obtidos, foram definidos protocolos de aquisição de imagens de microscopia, que possibilitam a aquisição de imagens das regiões passiveis de serem estudadas, assim como algoritmos que permitem automatizar o posterior processo de alinhamento de imagens de evidências, constituindo uma vantagem em relação ao processo de comparação manual.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

A construção de uma marca gráfica, signo que se pretende que identifique e sintetize uma entidade, deve ser consciente dos processos, objectivos e modus operandi que integram o seu contexto e tornam este tema ainda hoje um ponto central no design de identidade e no design de comunicação. Ainda assim, assistimos ao surgir de tendências que vão uniformizando várias marcas que procuram, passe o paradoxo, demarcar-se. Meme é um conceito originalmente publicado pelo biólogo Richard Dawkins (Dawkins, 1989), que significa ‘replicador’, sendo uma teoria alternativa para explicar a evolução humana (uma teoria que não depende dos genes, mas sim da noção de imitação: da noção de ideias que se reproduzem de pessoa para pessoa, quase como um vírus). O conceito vem da palavra grega mimeme e significa ‘aquilo que é imitado’. Este conceito foi desenvolvido por Susan Blackmore no livro The Meme Machine (1999) e, mais recentemente, esta autora introduz a ideia de teme – o meme tecnológico. Como explicar, por exemplo, que a recente imagem gráfica da NOS (2014) seja tão similar à da POV, criada por Paula Scher em 2007? E por sua vez, qual a razão da identidade visual da Optimus (magma, 2008) ser também, em certa medida, idêntica à da Nokia Trends Lab (criado por Greenspace), projecto do mesmo ramo de operação das telecomunicações? No modus operandi do trabalho de design de identidade entram em acção os media digitais, tanto no momento de concepção, como no momento de exibição e fruição das marcas gráficas. Assim, as aplicações, o software transformaram-se numa espécie de silent designers (conceito proposto por Gorb e Dumas em 1987), uma vez que são verdadeiros orientadores da resposta visual a um determinado problema: impulsionam direcções na linguagem visual do design, resultando em soluções semelhantes. Dada esta mudança de paradigmas que as novas tecnologias forjaram no zeitgeist do design, este artigo – baseado em parte da investigação de doutoramento em design – versa sobre a construção da marca gráfica e sobre a análise das categorias visuais que operam em cada signo gráfico da marca, bem como os medias digitais onde elas se inscrevem. Visualmente podemos constatar que as características dos nossos processos de percepção e as características dos meios de criação e transmissão das marcas actuam de forma a aproximar as soluções gráficas, resultando, por vezes, em temes. Com o objectivo de gerar debate académico sobre o tema da sintaxe e da retórica visual da marca gráfica, procuramos identificar e visualizar variáveis estruturais comuns das marcas realizadas com uma linguagem advinda do Estilo Internacional e das marcas mais recentes, digitais, fluídas e em sistema aberto, com a intenção de contribuir para implementar uma literacia visual que descodifique este signo icónico, dentro da actual realidade.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

In this work an adaptive modeling and spectral estimation scheme based on a dual Discrete Kalman Filtering (DKF) is proposed for speech enhancement. Both speech and noise signals are modeled by an autoregressive structure which provides an underlying time frame dependency and improves time-frequency resolution. The model parameters are arranged to obtain a combined state-space model and are also used to calculate instantaneous power spectral density estimates. The speech enhancement is performed by a dual discrete Kalman filter that simultaneously gives estimates for the models and the signals. This approach is particularly useful as a pre-processing module for parametric based speech recognition systems that rely on spectral time dependent models. The system performance has been evaluated by a set of human listeners and by spectral distances. In both cases the use of this pre-processing module has led to improved results.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

Speech interfaces for Assistive Technologies are not common and are usually replaced by others. The market they are targeting is not considered attractive and speech technologies are still not well spread. Industry still thinks they present some performance risks, especially Speech Recognition systems. As speech is the most elemental and natural way for communication, it has strong potential for enhancing inclusion and quality of life for broader groups of users with special needs, such as people with cerebral palsy and elderly staying at their homes. This work is a position paper in which the authors argue for the need to make speech become the basic interface in assistive technologies. Among the main arguments, we can state: speech is the easiest way to interact with machines; there is a growing market for embedded speech in assistive technologies, since the number of disabled and elderly people is expanding; speech technology is already mature to be used but needs adaptation to people with special needs; there is still a lot of R&D to be done in this area, especially when thinking about the Portuguese market. The main challenges are presented and future directions are proposed.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

A aprendizagem cooperativa, através da qual os alunos se ajudam no processo de aprendizagem (Argyle, 1991; Balkcom, 1992; Johnson, Johnson, & Holubec, 1994) encontra nas artes plásticas um meio privilegiado de comunicação e estimulação sensorial. Este estudo visa examinar os efeitos da implementação de um programa de atividades cooperativas no âmbito das artes plásticas sobre o processo de inclusão de crianças com Perturbação do Espectro do Autismo (PEA) nas suas turmas de ensino regular, estando sobre análise: (i) o seu envolvimento e satisfação nas atividades dinamizadas; (ii) a interação estabelecida com os pares; (iii) e o apoio/ atitudes dos pares com desenvolvimento típico na relação com os colegas com PEA. Implementado em duas turmas do 1.º Ciclo do Ensino Básico, os efeitos do programa foram estudados, mediante a implementação de um estudo de caso único, tipo AB, com um desenho de múltiplas linhas de base. Para o efeito foram analisados registos de observação de seis crianças com autismo e de seis pares que compunham as díades de trabalho; e da entrevista aos professores das turmas. A socialização e desenvolvimento de atitudes positivas por parte dos alunos com desenvolvimento típico foi também aferida através de uma entrevista dirigida aos próprios. Os resultados são sugestivos de um global aumento da interação, do envolvimento e satisfação dos alunos com PEA – registando-se maior expressão destes indicadores aquando do uso de técnicas de teor mais sensorial (como monotipia, desenho, modelagem). O programa parece ter também promovido comportamentos mais apoiantes por parte dos pares na maximização da participação dos alunos com PEA - parecendo reforçar o reconhecimento das atividades artísticas cooperativas como promotoras de relações de interajuda e de mútuo conhecimento.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

Face à atual crise económica, cada vez mais as empresas procuram ganhar vantagens competitivas através da implementação da sua melhoria contínua. Uma das vertentes deste processo consiste na melhoria da gestão de stocks. O presente trabalho tem como objetivo o desenvolvimento de um projeto que visa a melhoria do sistema de gestão de stocks da FUTE – Fábrica de Utilidades de Tubo, SA. A principal motivação para o desenvolvimento deste trabalho teve como base as lacunas e falhas constatadas num departamento que é crítico para o desenvolvimento de todo o processo produtivo. O trabalho envolveu a utilização de modelos de gestão de stocks o que fez com que, através de cálculos efetuados, diminuísse o risco de rutura de materiais. Além disso, envolveu as várias etapas da técnica dos 5S’s, bem como a Gestão Visual garantindo, assim, os locais arrumados, limpos, seguros e devidamente identificados. Estas técnicas foram aplicadas em diferentes locais da empresa e, após essa implementação, verificou-se, por parte dos trabalhadores, uma redução de tempos no que toca à procura e identificação de materiais necessários para a linha de montagem. Essa redução de tempos foi também sentida por parte do responsável pelos stocks pois, com estas alterações, os materiais ficam mais acessíveis e mais fáceis de identificar aquando da sua verificação. Os resultados alcançados traduziram-se num aumento dos níveis de produtividade e qualidade, bem como um aumento da satisfação dos trabalhadores, que se traduz numa alteração de mentalidades e comportamentos.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

As novas tecnologias de informação e comunicação vêm introduzir novas abordagens e orientações nas relações das pessoas no mundo global, ao mesmo tempo que vêm redefinir paradigmas diversos em várias áreas disciplinares, nomeadamente nas áreas da saúde e da educação. A massificação das tecnologias vem assim aproximar a informação e o conhecimento das pessoas e a sua utilização no apoio aos processos de ensino e de aprendizagem dos alunos com necessidades educativas especiais e dificuldades de aprendizagem específicas tem vindo a ser discutida cada vez mais com uma maior relevância. Pretende-se através da presente dissertação contribuir com soluções que apoiem a desmaterialização dos processos e desburocratização dos relacionamentos entres os diversos intervenientes num processo de terapia de uma criança. Apesar de poder ser extensível a outros cenários, o projeto desenvolvido aplica-se ao caso concreto de crianças com necessidades educativas especiais e dificuldades de aprendizagem específicas, motivadas por dificuldades de perceção visual, que obrigam, além da adoção de programas de treino, como jogos interativos, a um acompanhamento integrado de todos os intervenientes na sua terapia: terapeutas, professores, pais e educadores, assistentes sociais entre outros, tornando-se fundamental a utilização de uma plataforma universal que permita a troca e sistematização de informações. Inicialmente foi necessário um enquadramento desta temática por via da leitura, pesquisa e reuniões com elementos ligados a diferentes áreas que intervém no tratamento de necessidades educativas especiais. Depois de uma pesquisa bibliográfica inicial sobre as dimensões a explorar, recolheu-se informação sobre estudos e projetos desenvolvidos para apoiar esta área, e desenvolveu-se um projeto destinado a contribuir para o trabalho positivo de todos os profissionais que se dedicam à terapia/tratamento das crianças com necessidades educativas especiais, particularmente derivadas de dificuldades de perceção visual. Posteriormente, realizou-se a avaliação do protótipo de forma a validar o real contributo do sistema na melhoria da comunicação e partilha de informação entre todos os intervenientes no processo de terapia de crianças com necessidades educativas especiais e da utilização das tecnologias interativas no treino da perceção visual. Com vista a uma futura implementação de um recurso educativo deste âmbito, foram também recolhidos os pontos negativos e sugestões de melhoria a incorporar. Em suma, este trabalho valida os contributos das TIC, e deste sistema em particular, na relação dos intervenientes num processo de terapia interdisciplinar e no treino da perceção visual.