1000 resultados para Aprenentatge per reforç


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Presentació de l’experiència que s’ha portat a terme en l’Escola Politècnica Superior de la UdG en l’assignatura de Fonaments Físics per l’Enginyeria aplicant com a tècnica l’aprenentatge basat en problemes: Project Based Learning (APB)

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Resumen de los autores en catalán

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Resumen de la revista en catalán. Este artículo forma parte del monográfico 'Experiències d'escoles'

Relevância:

100.00% 100.00%

Publicador:

Resumo:

L’objectiu d’aquest projecte, a banda de plantejar un aprenentatge directament relacionat amb l’entorn de l’alumne, tracta d’aconseguir que les assignatures i les disciplines autònomes perdin parcialment el seu caràcter i passin a formar part d’una unitat més global (Mallart, 1998). Per aconseguir això, els alumnes han de transformar un programa de cuina de l’Arguiñano en un programa de radio, amb la peculiaritat que en el programa de radio cal explicar quin son els secrets científics que s‘amaguen quan l’Arguiñano està cuinant en el programa. Aquest secrets científics estaran relacionats amb les diferents disciplines dels membres la xarxa i s’aplicarà el mètode d’aprenentatge basat en projectes (APP).

Relevância:

100.00% 100.00%

Publicador:

Resumo:

La finalitat de l’experiència és oferir un recurs multimèdia, una webquest, per a l’alumnat dels estudis de Grau de Mestre en Educació Primària, per tal que aprenguin una forma més de realitzar planificacions didàctiques d’acord amb el marc teòric que sustenta l’Educació Inclusiva, l’accés universal a un currículum per a tothom i la normativa en matèria d’educació. L’experiència promou la innovació educativa mitjançant l'adequació dels ensenyaments a l'EEES, possibilitant el desenvolupament de determinades competències dels plans d'estudis implicats. Alhora, promou l'experimentació i avaluació de noves metodologies docents i l'elaboració i avaluació de materials d'aprenentatge autònom.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Reinforcement learning (RL) is a very suitable technique for robot learning, as it can learn in unknown environments and in real-time computation. The main difficulties in adapting classic RL algorithms to robotic systems are the generalization problem and the correct observation of the Markovian state. This paper attempts to solve the generalization problem by proposing the semi-online neural-Q_learning algorithm (SONQL). The algorithm uses the classic Q_learning technique with two modifications. First, a neural network (NN) approximates the Q_function allowing the use of continuous states and actions. Second, a database of the most representative learning samples accelerates and stabilizes the convergence. The term semi-online is referred to the fact that the algorithm uses the current but also past learning samples. However, the algorithm is able to learn in real-time while the robot is interacting with the environment. The paper shows simulated results with the "mountain-car" benchmark and, also, real results with an underwater robot in a target following behavior

Relevância:

100.00% 100.00%

Publicador:

Resumo:

This paper presents a hybrid behavior-based scheme using reinforcement learning for high-level control of autonomous underwater vehicles (AUVs). Two main features of the presented approach are hybrid behavior coordination and semi on-line neural-Q_learning (SONQL). Hybrid behavior coordination takes advantages of robustness and modularity in the competitive approach as well as efficient trajectories in the cooperative approach. SONQL, a new continuous approach of the Q_learning algorithm with a multilayer neural network is used to learn behavior state/action mapping online. Experimental results show the feasibility of the presented approach for AUVs

Relevância:

100.00% 100.00%

Publicador:

Resumo:

This paper proposes a field application of a high-level reinforcement learning (RL) control system for solving the action selection problem of an autonomous robot in cable tracking task. The learning system is characterized by using a direct policy search method for learning the internal state/action mapping. Policy only algorithms may suffer from long convergence times when dealing with real robotics. In order to speed up the process, the learning phase has been carried out in a simulated environment and, in a second step, the policy has been transferred and tested successfully on a real robot. Future steps plan to continue the learning process on-line while on the real robot while performing the mentioned task. We demonstrate its feasibility with real experiments on the underwater robot ICTINEU AUV

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Autonomous underwater vehicles (AUV) represent a challenging control problem with complex, noisy, dynamics. Nowadays, not only the continuous scientific advances in underwater robotics but the increasing number of subsea missions and its complexity ask for an automatization of submarine processes. This paper proposes a high-level control system for solving the action selection problem of an autonomous robot. The system is characterized by the use of reinforcement learning direct policy search methods (RLDPS) for learning the internal state/action mapping of some behaviors. We demonstrate its feasibility with simulated experiments using the model of our underwater robot URIS in a target following task

Relevância:

100.00% 100.00%

Publicador:

Resumo:

This paper proposes a high-level reinforcement learning (RL) control system for solving the action selection problem of an autonomous robot. Although the dominant approach, when using RL, has been to apply value function based algorithms, the system here detailed is characterized by the use of direct policy search methods. Rather than approximating a value function, these methodologies approximate a policy using an independent function approximator with its own parameters, trying to maximize the future expected reward. The policy based algorithm presented in this paper is used for learning the internal state/action mapping of a behavior. In this preliminary work, we demonstrate its feasibility with simulated experiments using the underwater robot GARBI in a target reaching task

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Darrerament, l'interès pel desenvolupament d'aplicacions amb robots submarins autònoms (AUV) ha crescut de forma considerable. Els AUVs són atractius gràcies al seu tamany i el fet que no necessiten un operador humà per pilotar-los. Tot i això, és impossible comparar, en termes d'eficiència i flexibilitat, l'habilitat d'un pilot humà amb les escasses capacitats operatives que ofereixen els AUVs actuals. L'utilització de AUVs per cobrir grans àrees implica resoldre problemes complexos, especialment si es desitja que el nostre robot reaccioni en temps real a canvis sobtats en les condicions de treball. Per aquestes raons, el desenvolupament de sistemes de control autònom amb l'objectiu de millorar aquestes capacitats ha esdevingut una prioritat. Aquesta tesi tracta sobre el problema de la presa de decisions utilizant AUVs. El treball presentat es centra en l'estudi, disseny i aplicació de comportaments per a AUVs utilitzant tècniques d'aprenentatge per reforç (RL). La contribució principal d'aquesta tesi consisteix en l'aplicació de diverses tècniques de RL per tal de millorar l'autonomia dels robots submarins, amb l'objectiu final de demostrar la viabilitat d'aquests algoritmes per aprendre tasques submarines autònomes en temps real. En RL, el robot intenta maximitzar un reforç escalar obtingut com a conseqüència de la seva interacció amb l'entorn. L'objectiu és trobar una política òptima que relaciona tots els estats possibles amb les accions a executar per a cada estat que maximitzen la suma de reforços totals. Així, aquesta tesi investiga principalment dues tipologies d'algoritmes basats en RL: mètodes basats en funcions de valor (VF) i mètodes basats en el gradient (PG). Els resultats experimentals finals mostren el robot submarí Ictineu en una tasca autònoma real de seguiment de cables submarins. Per portar-la a terme, s'ha dissenyat un algoritme anomenat mètode d'Actor i Crític (AC), fruit de la fusió de mètodes VF amb tècniques de PG.