903 resultados para hand-drawn visual language recognition
Resumo:
This paper investigated using lip movements as a behavioural biometric for person authentication. The system was trained, evaluated and tested using the XM2VTS dataset, following the Lausanne Protocol configuration II. Features were selected from the DCT coefficients of the greyscale lip image. This paper investigated the number of DCT coefficients selected, the selection process, and static and dynamic feature combinations. Using a Gaussian Mixture Model - Universal Background Model framework an Equal Error Rate of 2.20% was achieved during evaluation and on an unseen test set a False Acceptance Rate of 1.7% and False Rejection Rate of 3.0% was achieved. This compares favourably with face authentication results on the same dataset whilst not being susceptible to spoofing attacks.
Resumo:
The chapter argues that language and cultural communication matter in a transnational world and that the transmission of prejudices against minorities has to be closely analysed while contextualising national histories with minorities. Looking at two spatial sites (Leeds and Warsaw) and analysing interview material that was drawn from a larger study, the authors discuss the way local people address difference particularly through the axes of gendered ethnicity (Muslim men) and gendered class (male underclass). It explores how the same categories of difference are discursively produced in Poland and the UK/ England; to what degree they differ or overlap.
Resumo:
Este trabalho, desenvolvido por uma professora em contexto académico, movida por uma vontade de intervenção em contexto escolar para melhoria da qualidade do desempenho profissional e das aprendizagens dos alunos, assenta: por um lado, num entendimento de desenvolvimento profissional (DP) enquanto processo contínuo que se articula com e inscreve na prática do quotidiano docente; e, por outro lado, num entendimento da educação em línguas como um processo que valoriza a diversidade e enfatiza o plurilinguismo como valor e competência, enriquecendo os repertórios linguístico-comunicativos dos sujeitos, de modo a facilitar a abertura ao Outro, num processo de construção e recriação de significado sobre o mundo e sobre si na relação com esse Outro. Pretendeu-se, neste estudo, compreender o processo de desenvolvimento profissional de professores de línguas, tentando identificar potencialidades e constrangimentos que se colocam a esse desenvolvimento profissional em contexto. Para tal, foi desenvolvido um projecto de formação para a educação plurilingue numa escola Secundária com 3º Ciclo do Ensino Básico com um grupo de cinco professoras ao longo de dois anos. A formação, promovida através de um Centro de Formação de Escolas e acreditada pelo Conselho- Científico da Formação Contínua desenvolveu-se em duas fases. A primeira fase (2004/2005), na modalidade Oficina de Formação com 10 sessões de formação num total de 50 horas, e a segunda fase (2005/2006), na modalidade Projecto com nove sessões de formação, num total de 50 horas. O estudo seguiu uma metodologia de cariz qualitativo e de inspiração interpretativa/fenomenológica, pretendendo colocar em evidência o sujeito e sublinhando a interacção que estabelece consigo e com os outros, a partir das práticas discursivas que vai construindo. A estratégia investigativa desenhou-se em torno do estudo de caso no qual procurámos analisar a (des/re)construção de conhecimento profissional no contexto de um grupo de professoras em formação. Esta análise assumiu duas vertentes, uma tomando a interacção entre o grupo como alvo de análise, outra olhando para o percurso de cada formanda na sua singularidade. Os dados recolhidos e analisados incluem um inquérito por questionário inicial, a transcrição das sessões de formação e as reflexões escritas ao longo das duas fases da formação, bem como um inquérito por entrevista semiestruturada, após o terminus da formação, em Julho de 2007. Os resultados da análise indicam que os processos formativos que promovem o questionamento de si e das suas práticas, ajudando a identificar representações e a analisar o modo como as representações interferem ou não nas práticas para, em seguida, estas poderem ser reconstruídas, são facilitadores de DP. Evidenciaram-se, nestes processos, dois tempos de formação distintos, mas complementares, o tempo da observação e da análise e o tempo da apropriação e da acção, que englobam espaços de trabalho individual e colectivo. Nestes dois tempos de formação identificámos quatro modos facilitadores da reconstrução do conhecimento profissional, nomeadamente: a articulação da teoria com a prática; a tomada do objecto de trabalho em objecto de análise e de experimentação, incluindo a visualização, a análise e a reflexão sobre as experiências realizadas; a colocação do aluno no centro do processo de ensino; e o alargamento da consciencialização do trabalho com as línguas e das suas finalidades educativas. Estes quatro modos constituem-se como impulsionadores ou inibidores de DP, dependendo a sua percepção de factores, tanto de carácter individual como de carácter colectivo. Os factores de carácter individual dizem respeito ao comprometimento, ao empenho, ao modo como cada sujeito se vê como pessoa e como profissional, bem como à fase da carreira em que se situa. Os factores de carácter colectivo dizem respeito aos contextos nos quais o sujeito se move, nomeadamente a cultura da escola em que exerce funções, às relações interpessoais e profissionais que estabelece com os colegas de trabalho e às possibilidades e espaços de formação que cada sujeito encontra com os outros. Tendo constatado que o desenvolvimento profissional é fruto da intersecção da acção individual com a acção colectiva, concluímos que, na constituição de ambientes facilitadores de DP, importa ter em conta seis componentes: a apropriação individual da construção do conhecimento profissional pelos sujeitos, a construção de oportunidades de desenvolvimento, a construção da capacidade de intervenção em contexto, a promoção da colegialidade, a monitorização e avaliação de processos e resultados do trabalho no âmbito do DP e a criação de espaços e tempos próprios para esse trabalho. Os resultados da análise indicam também que a formação em contexto permite iniciar um trabalho de DP porque cria condições de auto/hetero/eco e coformação que incluem um potencial de aprendizagem profissional transformativa. Enquanto constrangimentos ao DP em contexto destacam-se aspectos contextuais que se relacionam com o tempo e a sua gestão, bem como com a visibilidade, o reconhecimento e o impacto do trabalho realizado no contexto. Através da descrição e análise de uma experiência de formação contínua em contexto, este trabalho revela possibilidades de ultrapassar os constrangimentos contextuais, sublinhando as potencialidades de desenvolvimento profissional em contexto, pelo modo como professoras, predispostas à mudança e comprometidas com a profissão, onde os alunos têm um papel particular, são capazes de inscrever transformação nas suas práticas, evidenciando a urgência não só de um apoio concreto e explícito, mas também de reconhecimento do trabalho desenvolvido em cada sala de aula, com cada turma, à descoberta de si e do outro, através das línguas para a construção de um mundo mais plural.
Resumo:
Este estudo investiga a influência da interação imagem-texto de três álbuns ilustrados de língua inglesa no desenvolvimento do repertório linguístico de crianças pré-leitoras. Numa metodologia de estudo de caso, adotando uma abordagem qualitativa e socio construtivista num contexto real de educação pré-escolar, três grupos de crianças portuguesas foram filmados ao longo de várias sessões de leitura repetida em voz alta e em inglês, e de sessões de recontos trabalhados em pequenos grupos. Após a transcrição das gravações, o corpus resultante foi analisado com base numa teoria fundamentada de compreensão literária e em escalas de leitura emergente. Os resultados mostraram que as crianças adotaram uma postura fortemente analítica face aos álbuns, direcionando as suas respostas para as ilustrações e usando-as como apoio na construção de significados. Os resultados mostraram também que cada interanimação visual e verbal ofereceu diversas oportunidades para o uso das línguas em presença, o português e o inglês, tendo o formato e a estrutura inerentes a cada álbum contribuído de forma muito relevante para as respostas das crianças. Contudo, os álbuns com uma dinâmica imagem-texto mais complexa proporcionaram um maior envolvimento das crianças, provocando mais discussão em torno das ilustrações e criando mais oportunidades para mediação do uso da segunda língua. Os resultados revelaram ainda a importância da interação durante as leituras repetidas, na compreensão e na análise narrativa, num processo de desenvolvimento da linguagem. Com base nestes resultados, apontam-se conclusões, com implicações para os contextos educativos, quer ao nível da língua materna, quer ao nível da segunda língua, nomeadamente em relação: à seleção de álbuns e à valorização das ilustrações e ainda à importância de leituras repetidas em voz alta e à discussão realizada pelas crianças.
Resumo:
This thesis addresses the problem of word learning in computational agents. The motivation behind this work lies in the need to support language-based communication between service robots and their human users, as well as grounded reasoning using symbols relevant for the assigned tasks. The research focuses on the problem of grounding human vocabulary in robotic agent’s sensori-motor perception. Words have to be grounded in bodily experiences, which emphasizes the role of appropriate embodiments. On the other hand, language is a cultural product created and acquired through social interactions. This emphasizes the role of society as a source of linguistic input. Taking these aspects into account, an experimental scenario is set up where a human instructor teaches a robotic agent the names of the objects present in a visually shared environment. The agent grounds the names of these objects in visual perception. Word learning is an open-ended problem. Therefore, the learning architecture of the agent will have to be able to acquire words and categories in an openended manner. In this work, four learning architectures were designed that can be used by robotic agents for long-term and open-ended word and category acquisition. The learning methods used in these architectures are designed for incrementally scaling-up to larger sets of words and categories. A novel experimental evaluation methodology, that takes into account the openended nature of word learning, is proposed and applied. This methodology is based on the realization that a robot’s vocabulary will be limited by its discriminatory capacity which, in turn, depends on its sensors and perceptual capabilities. An extensive set of systematic experiments, in multiple experimental settings, was carried out to thoroughly evaluate the described learning approaches. The results indicate that all approaches were able to incrementally acquire new words and categories. Although some of the approaches could not scale-up to larger vocabularies, one approach was shown to learn up to 293 categories, with potential for learning many more.
Resumo:
Geographical representations of topographical space come in many shapes and are a regular topic of discussion. The depiction of the invisible and maybe even illusory concept of time on the other hand, remains largely unchanged and undisputed. A uniform and arithmetic model of time fits well with the rigid structure of digital data, which might be why it has been widely adopted within HCI. In our proposal, we will present historic and contemporary approaches that offer alternative perspectives on the visual representation of time. Keywords: timeline, chronographics
Resumo:
Models of visual perception are based on image representations in cortical area V1 and higher areas which contain many cell layers for feature extraction. Basic simple, complex and end-stopped cells provide input for line, edge and keypoint detection. In this paper we present an improved method for multi-scale line/edge detection based on simple and complex cells. We illustrate the line/edge representation for object reconstruction, and we present models for multi-scale face (object) segregation and recognition that can be embedded into feedforward dorsal and ventral data streams (the “what” and “where” subsystems) with feedback streams from higher areas for obtaining translation, rotation and scale invariance.
Resumo:
There are roughly two processing systems: (1) very fast gist vision of entire scenes, completely bottom-up and data driven, and (2) Focus-of-Attention (FoA) with sequential screening of specific image regions and objects. The latter system has to be sequential because unnormalised input objects must be matched against normalised templates of canonical object views stored in memory, which involves dynamic routing of features in the visual pathways.
Resumo:
Lines and edges provide important information for object categorization and recognition. In addition, one brightness model is based on a symbolic interpretation of the cortical multi-scale line/edge representation. In this paper we present an improved scheme for line/edge extraction from simple and complex cells and we illustrate the multi-scale representation. This representation can be used for visual reconstruction, but also for nonphotorealistic rendering. Together with keypoints and a new model of disparity estimation, a 3D wireframe representation of e.g. faces can be obtained in the future.
Resumo:
Object recognition requires that templates with canonical views are stored in memory. Such templates must somehow be normalised. In this paper we present a novel method for obtaining 2D translation, rotation and size invariance. Cortical simple, complex and end-stopped cells provide multi-scale maps of lines, edges and keypoints. These maps are combined such that objects are characterised. Dynamic routing in neighbouring neural layers allows feature maps of input objects and stored templates to converge. We illustrate the construction of group templates and the invariance method for object categorisation and recognition in the context of a cortical architecture, which can be applied in computer vision.
Resumo:
We present a 3D representation that is based on the pro- cessing in the visual cortex by simple, complex and end-stopped cells. We improved multiscale methods for line/edge and keypoint detection, including a method for obtaining vertex structure (i.e. T, L, K etc). We also describe a new disparity model. The latter allows to attribute depth to detected lines, edges and keypoints, i.e., the integration results in a 3D \wire-frame" representation suitable for object recognition.
Resumo:
Face detection and recognition should be complemented by recognition of facial expression, for example for social robots which must react to human emotions. Our framework is based on two multi-scale representations in cortical area V1: keypoints at eyes, nose and mouth are grouped for face detection [1]; lines and edges provide information for face recognition [2].
Resumo:
In this paper we present an improved model for line and edge detection in cortical area V1. This model is based on responses of simple and complex cells, and it is multi-scale with no free parameters. We illustrate the use of the multi-scale line/edge representation in different processes: visual reconstruction or brightness perception, automatic scale selection and object segregation. A two-level object categorization scenario is tested in which pre-categorization is based on coarse scales only and final categorization on coarse plus fine scales. We also present a multi-scale object and face recognition model. Processing schemes are discussed in the framework of a complete cortical architecture. The fact that brightness perception and object recognition may be based on the same symbolic image representation is an indication that the entire (visual) cortex is involved in consciousness.
Resumo:
Empirical studies concerning face recognition suggest that faces may be stored in memory by a few canonical representations. Models of visual perception are based on image representations in cortical area V1 and beyond, which contain many cell layers for feature extraction. Simple, complex and end-stopped cells provide input for line, edge and keypoint detection. Detected events provide a rich, multi-scale object representation, and this representation can be stored in memory in order to identify objects. In this paper, the above context is applied to face recognition. The multi-scale line/edge representation is explored in conjunction with keypoint-based saliency maps for Focus-of-Attention. Recognition rates of up to 96% were achieved by combining frontal and 3/4 views, and recognition was quite robust against partial occlusions.
Resumo:
Empirical studies concerning face recognition suggest that faces may be stored in memory by a few canonical representations. In cortical area V1 exist double-opponent colour blobs, also simple, complex and end-stopped cells which provide input for a multiscale line/edge representation, keypoints for dynamic feature routine, and saliency maps for Focus-of-Attention.