907 resultados para Visual Odometry,Transformer,Deep learning
Resumo:
Tese (doutorado)—Universidade de Brasília, Faculdade de Comunicação, Programa de Pós-Graduação em Comunicação, 2016.
Resumo:
No presente livro, apresenta-se uma síntese do trabalho de campo desenvolvido para Portugal, no âmbito do primeiro ano de atividade do projeto ERASMUS+ intitulado ISOLearn for HEI: Innovation and Social Learning for Higher Education Institutions (http://www.ISOLearn.net/), entre Outubro de 2014 e Outubro de 2016. No âmbito deste projeto europeu, coordenado pela Universidade Aberta, procurou-se fazer um levantamento das condições existentes para a inclusão de pessoas com deficiência visual e auditiva no Ensino Superior, em 4 países europeus: Portugal; Itália; Suécia e Eslovénia. Para tal foi desenvolvido um trabalho que consistiu na realização de entrevistas a Instituições de Ensino Superior (IES), e um conjunto de questionários online, a estudantes com este tipo de deficiências. Procurou-se fazer este levantamento enquadrado na legislação existente sobre este tema, e sobretudo na sensibilidade das principais partes interessadas (stakeholders) nesta temática, aferindo a sua perceção da realidade, procurando-se desta forma identificar eventuais desajustes entre o enquadramento legal e institucional vigente, e a prática das Instituições de Ensino Superior (IES) em cada um dos quatro países envolvidos. Considerando que os parceiros portugueses incluem entidades que se dedicam exclusivamente aos problemas da população em estudo, como é o caso da ACAPO – Associação dos Cegos e Amblíopes de Portugal; da APS – Associação Portuguesa de Surdos; e da Fundação Calouste Gulbenkian, que tem vindo a desenvolver trabalho na consagração dos Direitos Humanos e da inclusão de pessoas com deficiência; que por essa razão o trabalho de campo desenvolvido pelos parceiros portugueses foi extremamente rigoroso e em certa medida mais aprofundado, quer em termos metodológicos, quer em termos de amostra obtida – com entrevistas a 23 IES, e a participação de 49 estudantes, repartidos entre estudantes com deficiência visual e estudantes com deficiência auditiva – entendeu-se que seria importante autonomizar o trabalho sobre Portugal, dando-lhe a visibilidade que a edição eletrónica do presente livro pretende comportar. A presente edição pretende, pois, constituir apenas um pequeno pilar para o desenvolvimento do conhecimento sobre esta matéria em Portugal. É objetivo da equipa do projeto que, a partir da sua leitura se despertem consciências que levem à realização de mais trabalhos sobre esta temática, que possam permitir, não apenas uma maior sensibilização da sociedade portuguesa em geral sobre estas matérias, mas também, incitar todas as partes interessadas à ação, no sentido de uma maior inclusão das pessoas com deficiência visual e auditiva, no Ensino Superior. Naturalmente, tratando-se de um trabalho desenvolvido no âmbito de um projeto europeu, os objetivos definitivos vão para além das fronteiras nacionais, esperando-se que ele possa ajudar a própria Europa a desenvolver mais e melhores políticas para abordagem à temática da inclusão das pessoas com deficiência visual e auditiva no Ensino Superior no espaço europeu. Este deve ser considerado um trabalho em aberto; apenas um primeiro passo de uma longa e, espera-se, frutuosa caminhada, cujo destino será a inclusão das pessoas com deficiência visual e auditiva, no Ensino Superior.
Resumo:
Early human development offers a unique perspective in investigating the potential cognitive and social implications of action and perception. Specifically, during infancy, action production and action perception undergo foundational developments. One essential component to examine developments in action processing is the analysis of others’ actions as meaningful and goal-directed. Little research, however, has examined the underlying neural systems that may be associated with emerging action and perception abilities, and infants’ learning of goal-directed actions. The current study examines the mu rhythm—a brain oscillation found in the electroencephalogram (EEG)—that has been associated with action and perception. Specifically, the present work investigates whether the mu signal is related to 9-month-olds’ learning of a novel goal-directed means-end task. The findings of this study demonstrate a relation between variations in mu rhythm activity and infants’ ability to learn a novel goal-directed means-end action task (compared to a visual pattern learning task used as a comparison task). Additionally, we examined the relations between standardized assessments of early motor competence, infants’ ability to learn a novel goal-directed task, and mu rhythm activity. We found that: 1a) mu rhythm activity during observation of a grasp uniquely predicted infants’ learning on the cane training task, 1b) mu rhythm activity during observation and execution of a grasp did not uniquely predict infants’ learning on the visual pattern learning task (comparison learning task), 2) infants’ motor competence did not predict infants’ learning on the cane training task, 3) mu rhythm activity during observation and execution was not related to infants’ measure of motor competence, and 4) mu rhythm activity did not predict infants’ learning on the cane task above and beyond infants’ motor competence. The results from this study demonstrate that mu rhythm activity is a sensitive measure to detect individual differences in infants’ action and perception abilities, specifically their learning of a novel goal-directed action.
Resumo:
A educação na arte e pela arte confere a todos os seus intervenientes a estimulação da sua criatividade e da sua consciência cultural, proporcionando meios para se exprimirem e participarem ativamente no mundo que nos rodeia. A integração das tecnologias de informação e comunicação no processo de ensino-aprendizagem veio alargar o papel que a arte pode desempenhar neste processo, promovendo novas formas de aprender, de ensinar e de pensar. Assim, a utilização de ambientes virtuais em contexto educativo tem revelado um enorme potencial, sobretudo ao nível da comunicação e da interação entre alunos e obras de arte. Neste sentido, considerou-se importante desenvolver um estudo de caso em contexto de sala de aula da Educação Visual, promovendo uma aprendizagem baseada na articulação entre a observação, interpretação e análise da obra de arte e o museu virtual. Assim o principal objetivo deste estudo foi avaliar as potencialidades do Google Art Project, enquanto objeto de aprendizagem, na promoção da aprendizagem na área da literacia em artes. Para além disso, procurámos ainda avaliar se a utilização de ferramentas multimédia como o referido Google Art Project e o Quadro Interativo, constituem fatores de motivação na aprendizagem da disciplina de Educação Visual. Do ponto de vista metodológico desenvolvemos uma estratégia baseada na investigação-ação. Procurámos, por um lado, descobrir e compreender o significado de uma realidade vivida por um grupo de alunos e, por outro lado, refletir sobre a prática educativa com o intuito de a melhorar e transformar. Este estudo envolveu cinco turmas do sexto ano do ensino público. Para a recolha de dados utilizámos técnicas baseadas na conversação e na observação, no questionário e nas notas de campo. Os resultados deste estudo revelam que as ferramentas tecnológicas utilizadas podem efetivamente contribuir para a promoção da aprendizagem dos alunos na área da Educação Visual, mais concretamente ao nível do domínio da literacia artística, da representação e da interpretação visual.
Resumo:
This paper aims at studying how circular dance can afford to sight-disabled peoples movement and how they can learn to cope with the deep movement of relation, consciousness, appropriation and communion with the world. Inside circular dance, a cosmic metaphor, is inscribed the movement of the world, which tells and changes amorously the human history. In the works of Paulo Freire and Maurice Merleau-Ponty one can find the necessary support to discuss, as long as possible, movement and existence. Research-action is used as a methodological approach whose empirical center is placed on the Institute of Education and Rehabilitation of Blind, in Natal, which shelters eight sightdisabled adults. The research s data reveal that the practice of circular dance concurs to enlarge the movement of the research s subjects, to develop a more accurate perception of their selves and of their own capacities, as well as improve the relations Me/Others, Me/World, which require a context of differences. The study has revealed that the practice of dance develops a better perception of the limits and surpasses as a human condition and, in consequence, the discovery of one s own body and the other s body as a resource of lessons and representations of the self and of the world. It lets out the development of a new way of thinking and coping with discrimination surrounding the disabled persons. In movement, in circular dance, the barrier between sight disablement and vision loses force.
Resumo:
This thesis presents a study of the Grid data access patterns in distributed analysis in the CMS experiment at the LHC accelerator. This study ranges from the deep analysis of the historical patterns of access to the most relevant data types in CMS, to the exploitation of a supervised Machine Learning classification system to set-up a machinery able to eventually predict future data access patterns - i.e. the so-called dataset “popularity” of the CMS datasets on the Grid - with focus on specific data types. All the CMS workflows run on the Worldwide LHC Computing Grid (WCG) computing centers (Tiers), and in particular the distributed analysis systems sustains hundreds of users and applications submitted every day. These applications (or “jobs”) access different data types hosted on disk storage systems at a large set of WLCG Tiers. The detailed study of how this data is accessed, in terms of data types, hosting Tiers, and different time periods, allows to gain precious insight on storage occupancy over time and different access patterns, and ultimately to extract suggested actions based on this information (e.g. targetted disk clean-up and/or data replication). In this sense, the application of Machine Learning techniques allows to learn from past data and to gain predictability potential for the future CMS data access patterns. Chapter 1 provides an introduction to High Energy Physics at the LHC. Chapter 2 describes the CMS Computing Model, with special focus on the data management sector, also discussing the concept of dataset popularity. Chapter 3 describes the study of CMS data access patterns with different depth levels. Chapter 4 offers a brief introduction to basic machine learning concepts and gives an introduction to its application in CMS and discuss the results obtained by using this approach in the context of this thesis.
Resumo:
This paper investigates how textbook design may influence students’ visual attention to graphics, photos and text in current geography textbooks. Eye tracking, a visual method of data collection and analysis, was utilised to precisely monitor students’ eye movements while observing geography textbook spreads. In an exploratory study utilising random sampling, the eye movements of 20 students (secondary school students 15–17 years of age and university students 20–24 years of age) were recorded. The research entities were double-page spreads of current German geography textbooks covering an identical topic, taken from five separate textbooks. A two-stage test was developed. Each participant was given the task of first looking at the entire textbook spread to determine what was being explained on the pages. In the second stage, participants solved one of the tasks from the exercise section. Overall, each participant studied five different textbook spreads and completed five set tasks. After the eye tracking study, each participant completed a questionnaire. The results may verify textbook design as one crucial factor for successful knowledge acquisition from textbooks. Based on the eye tracking documentation, learning-related challenges posed by images and complex image-text structures in textbooks are elucidated and related to educational psychology insights and findings from visual communication and textbook analysis.
Resumo:
El propósito de este estudio es medir los efectos que tiene el videojuego League of Legends en los procesos cognitivos de memoria de trabajo visual (MVT) y solución de problemas (SP). Para medir dichos efectos se implementó un diseño pre test-post con un grupo experimental y uno control, compuestos cada uno por siete participantes, en donde se evaluaron los procesos previamente mencionados utilizando los cubos de Corsi para MVT y las matrices del WAIS III para SP. Después de realizar los respectivos entrenamientos se encontraron resultados significativos en los diferentes momentos de aplicación. En el grupo experimental se encontraron diferencias en la variable dependiente SP, mientras que en el grupo control en MVT, pero no en la interacción entre grupos ni diferencias entre grupos, lo que sugiere un efecto de familiarización a la prueba.
Resumo:
Nella prima parte del mio lavoro viene presentato uno studio di una prima soluzione "from scratch" sviluppata da Andrew Karpathy. Seguono due miei miglioramenti: il primo modificando direttamente il codice della precedente soluzione e introducendo, come obbiettivo aggiuntivo per la rete nelle prime fasi di gioco, l'intercettazione della pallina da parte della racchetta, migliorando l'addestramento iniziale; il secondo é una mia personale implementazione utilizzando algoritmi più complessi, che sono allo stato dell'arte su giochi dell'Atari, e che portano un addestramento molto più veloce della rete.
Resumo:
Il periodo in cui viviamo rappresenta la cuspide di una forte e rapida evoluzione nella comprensione del linguaggio naturale, raggiuntasi prevalentemente grazie allo sviluppo di modelli neurali. Nell'ambito dell'information extraction, tali progressi hanno recentemente consentito di riconoscere efficacemente relazioni semantiche complesse tra entità menzionate nel testo, quali proteine, sintomi e farmaci. Tale task -- reso possibile dalla modellazione ad eventi -- è fondamentale in biomedicina, dove la crescita esponenziale del numero di pubblicazioni scientifiche accresce ulteriormente il bisogno di sistemi per l'estrazione automatica delle interazioni racchiuse nei documenti testuali. La combinazione di AI simbolica e sub-simbolica può consentire l'introduzione di conoscenza strutturata nota all'interno di language model, rendendo quest'ultimi più robusti, fattuali e interpretabili. In tale contesto, la verbalizzazione di grafi è uno dei task su cui si riversano maggiori aspettative. Nonostante l'importanza di tali contributi (dallo sviluppo di chatbot alla formulazione di nuove ipotesi di ricerca), ad oggi, risultano assenti contributi capaci di verbalizzare gli eventi biomedici espressi in letteratura, apprendendo il legame tra le interazioni espresse in forma a grafo e la loro controparte testuale. La tesi propone il primo dataset altamente comprensivo su coppie evento-testo, includendo diverse sotto-aree biomediche, quali malattie infettive, ricerca oncologica e biologia molecolare. Il dataset introdotto viene usato come base per l'addestramento di modelli generativi allo stato dell'arte sul task di verbalizzazione, adottando un approccio text-to-text e illustrando una tecnica formale per la codifica di grafi evento mediante testo aumentato. Infine, si dimostra la validità degli eventi per il miglioramento delle capacità di comprensione dei modelli neurali su altri task NLP, focalizzandosi su single-document summarization e multi-task learning.
Resumo:
Dopo lo sviluppo dei primi casi di Covid-19 in Cina nell’autunno del 2019, ad inizio 2020 l’intero pianeta è precipitato in una pandemia globale che ha stravolto le nostre vite con conseguenze che non si vivevano dall’influenza spagnola. La grandissima quantità di paper scientifici in continua pubblicazione sul coronavirus e virus ad esso affini ha portato alla creazione di un unico dataset dinamico chiamato CORD19 e distribuito gratuitamente. Poter reperire informazioni utili in questa mole di dati ha ulteriormente acceso i riflettori sugli information retrieval systems, capaci di recuperare in maniera rapida ed efficace informazioni preziose rispetto a una domanda dell'utente detta query. Di particolare rilievo è stata la TREC-COVID Challenge, competizione per lo sviluppo di un sistema di IR addestrato e testato sul dataset CORD19. Il problema principale è dato dal fatto che la grande mole di documenti è totalmente non etichettata e risulta dunque impossibile addestrare modelli di reti neurali direttamente su di essi. Per aggirare il problema abbiamo messo a punto nuove soluzioni self-supervised, a cui abbiamo applicato lo stato dell'arte del deep metric learning e dell'NLP. Il deep metric learning, che sta avendo un enorme successo soprattuto nella computer vision, addestra il modello ad "avvicinare" tra loro immagini simili e "allontanare" immagini differenti. Dato che sia le immagini che il testo vengono rappresentati attraverso vettori di numeri reali (embeddings) si possano utilizzare le stesse tecniche per "avvicinare" tra loro elementi testuali pertinenti (e.g. una query e un paragrafo) e "allontanare" elementi non pertinenti. Abbiamo dunque addestrato un modello SciBERT con varie loss, che ad oggi rappresentano lo stato dell'arte del deep metric learning, in maniera completamente self-supervised direttamente e unicamente sul dataset CORD19, valutandolo poi sul set formale TREC-COVID attraverso un sistema di IR e ottenendo risultati interessanti.
Resumo:
L'estrazione automatica degli eventi biomedici dalla letteratura scientifica ha catturato un forte interesse nel corso degli ultimi anni, dimostrandosi in grado di riconoscere interazioni complesse e semanticamente ricche espresse all'interno del testo. Purtroppo però, esistono davvero pochi lavori focalizzati sull'apprendimento di embedding o di metriche di similarità per i grafi evento. Questa lacuna lascia le relazioni biologiche scollegate, impedendo l'applicazione di tecniche di machine learning che potrebbero dare un importante contributo al progresso scientifico. Approfittando dei vantaggi delle recenti soluzioni di deep graph kernel e dei language model preaddestrati, proponiamo Deep Divergence Event Graph Kernels (DDEGK), un metodo non supervisionato e induttivo in grado di mappare gli eventi all'interno di uno spazio vettoriale, preservando le loro similarità semantiche e strutturali. Diversamente da molti altri sistemi, DDEGK lavora a livello di grafo e non richiede nè etichette e feature specifiche per un determinato task, nè corrispondenze note tra i nodi. A questo scopo, la nostra soluzione mette a confronto gli eventi con un piccolo gruppo di eventi prototipo, addestra delle reti di cross-graph attention per andare a individuare i legami di similarità tra le coppie di nodi (rafforzando l'interpretabilità), e impiega dei modelli basati su transformer per la codifica degli attributi continui. Sono stati fatti ampi esperimenti su dieci dataset biomedici. Mostriamo che le nostre rappresentazioni possono essere utilizzate in modo efficace in task quali la classificazione di grafi, clustering e visualizzazione e che, allo stesso tempo, sono in grado di semplificare il task di semantic textual similarity. Risultati empirici dimostrano che DDEGK supera significativamente gli altri modelli che attualmente detengono lo stato dell'arte.
Resumo:
Reinforcement Learning is an increasingly popular area of Artificial Intelligence. The applications of this learning paradigm are many, but its application in mobile computing is in its infancy. This study aims to provide an overview of current Reinforcement Learning applications on mobile devices, as well as to introduce a new framework for iOS devices: Swift-RL Lib. This new Swift package allows developers to easily support and integrate two of the most common RL algorithms, Q-Learning and Deep Q-Network, in a fully customizable environment. All processes are performed on the device, without any need for remote computation. The framework was tested in different settings and evaluated through several use cases. Through an in-depth performance analysis, we show that the platform provides effective and efficient support for Reinforcement Learning for mobile applications.
Resumo:
Deep Neural Networks (DNNs) have revolutionized a wide range of applications beyond traditional machine learning and artificial intelligence fields, e.g., computer vision, healthcare, natural language processing and others. At the same time, edge devices have become central in our society, generating an unprecedented amount of data which could be used to train data-hungry models such as DNNs. However, the potentially sensitive or confidential nature of gathered data poses privacy concerns when storing and processing them in centralized locations. To this purpose, decentralized learning decouples model training from the need of directly accessing raw data, by alternating on-device training and periodic communications. The ability of distilling knowledge from decentralized data, however, comes at the cost of facing more challenging learning settings, such as coping with heterogeneous hardware and network connectivity, statistical diversity of data, and ensuring verifiable privacy guarantees. This Thesis proposes an extensive overview of decentralized learning literature, including a novel taxonomy and a detailed description of the most relevant system-level contributions in the related literature for privacy, communication efficiency, data and system heterogeneity, and poisoning defense. Next, this Thesis presents the design of an original solution to tackle communication efficiency and system heterogeneity, and empirically evaluates it on federated settings. For communication efficiency, an original method, specifically designed for Convolutional Neural Networks, is also described and evaluated against the state-of-the-art. Furthermore, this Thesis provides an in-depth review of recently proposed methods to tackle the performance degradation introduced by data heterogeneity, followed by empirical evaluations on challenging data distributions, highlighting strengths and possible weaknesses of the considered solutions. Finally, this Thesis presents a novel perspective on the usage of Knowledge Distillation as a mean for optimizing decentralized learning systems in settings characterized by data heterogeneity or system heterogeneity. Our vision on relevant future research directions close the manuscript.
Resumo:
In medicine, innovation depends on a better knowledge of the human body mechanism, which represents a complex system of multi-scale constituents. Unraveling the complexity underneath diseases proves to be challenging. A deep understanding of the inner workings comes with dealing with many heterogeneous information. Exploring the molecular status and the organization of genes, proteins, metabolites provides insights on what is driving a disease, from aggressiveness to curability. Molecular constituents, however, are only the building blocks of the human body and cannot currently tell the whole story of diseases. This is why nowadays attention is growing towards the contemporary exploitation of multi-scale information. Holistic methods are then drawing interest to address the problem of integrating heterogeneous data. The heterogeneity may derive from the diversity across data types and from the diversity within diseases. Here, four studies conducted data integration using customly designed workflows that implement novel methods and views to tackle the heterogeneous characterization of diseases. The first study devoted to determine shared gene regulatory signatures for onco-hematology and it showed partial co-regulation across blood-related diseases. The second study focused on Acute Myeloid Leukemia and refined the unsupervised integration of genomic alterations, which turned out to better resemble clinical practice. In the third study, network integration for artherosclerosis demonstrated, as a proof of concept, the impact of network intelligibility when it comes to model heterogeneous data, which showed to accelerate the identification of new potential pharmaceutical targets. Lastly, the fourth study introduced a new method to integrate multiple data types in a unique latent heterogeneous-representation that facilitated the selection of important data types to predict the tumour stage of invasive ductal carcinoma. The results of these four studies laid the groundwork to ease the detection of new biomarkers ultimately beneficial to medical practice and to the ever-growing field of Personalized Medicine.