8 resultados para Learning processes

em Archivo Digital para la Docencia y la Investigación - Repositorio Institucional de la Universidad del País Vasco


Relevância:

70.00% 70.00%

Publicador:

Resumo:

Multi-Agent Reinforcement Learning (MARL) algorithms face two main difficulties: the curse of dimensionality, and environment non-stationarity due to the independent learning processes carried out by the agents concurrently. In this paper we formalize and prove the convergence of a Distributed Round Robin Q-learning (D-RR-QL) algorithm for cooperative systems. The computational complexity of this algorithm increases linearly with the number of agents. Moreover, it eliminates environment non sta tionarity by carrying a round-robin scheduling of the action selection and execution. That this learning scheme allows the implementation of Modular State-Action Vetoes (MSAV) in cooperative multi-agent systems, which speeds up learning convergence in over-constrained systems by vetoing state-action pairs which lead to undesired termination states (UTS) in the relevant state-action subspace. Each agent's local state-action value function learning is an independent process, including the MSAV policies. Coordination of locally optimal policies to obtain the global optimal joint policy is achieved by a greedy selection procedure using message passing. We show that D-RR-QL improves over state-of-the-art approaches, such as Distributed Q-Learning, Team Q-Learning and Coordinated Reinforcement Learning in a paradigmatic Linked Multi-Component Robotic System (L-MCRS) control problem: the hose transportation task. L-MCRS are over-constrained systems with many UTS induced by the interaction of the passive linking element and the active mobile robots.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

[ES] El proceso de Bolonia ha remarcado una perspectiva institucional en la preocupación por la gestión de la calidad del servicio prestado en las universidades y otras instituciones de enseñanza superior. La calidad del servicio en la educación superior no se centra exclusivamente en el proceso de enseñanza- aprendizaje y en la relación entre docente y discente, sino que debe estar también garantizada en el servicio prestado por las bibliotecas universitarias, los servicios de acción social, los servicios académicos y las secretarías departamentales.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

19 p.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

[ES]Ikasnabar es una conferencia para hablar de tendencias en educación, sobre las nuevas tecnologías en el ámbito educativo y conocer personas que están generando buenas ideas y prácticas en su quehacer diario. Este libro intenta recoger todo ello con las contribuciones de autores noveles y de renombre que buscan la excelencia en los procesos de enseñanza-aprendizaje. Tres tendencias importantes de aprendizaje se están expandiendo. Microcontenidos, aprendizaje móvil y MOOCs son la cara de una misma moneda: microaprendizaje con contenido rico, abierto y desmenuzado. A medida que el consumo de Internet desde dispositivos móviles aumenta, el aprendizaje móvil con tecnologías como HTML5, software para MOOC, plataformas de contenidos de vídeo, etc., están siendo algunas de las claves de la nueva revolución en el ámbito educativo. El microcontenido hace referencia a los pequeños trozos de información digital en un estado permanente de flujo y circulación. Es a menudo un único tema, limitado en longitud, que se consume rápidamente y con frecuencia limitado por el software o por el dispositivo. Se trata de la puesta en común de recursos. Se basa en la interacción humano-a-humano con los medios de comunicación de Internet. El otro tema central de esta conferencia es el de los MOOC realizados por los profesores que quieren tomar ventaja en el comienzo de esta nueva era de la educación abierta con calidad. MOOCs son, básicamente, cursos abiertos y es necesario recordar los puntos esenciales de este tipo de instrucción. Los miniMOOCs son alternativas con menos horas en el proceso de aprendizaje. Hoy en día, un buen MOOC podrá ser la mejor tarjeta de presentación para profesores, expertos y estudiantes. Vivimos en tiempos de cambio con ámbitos en los que se mezcla el aprendizaje formal e informal, y las universidades y colegios deberíamos estar atentos a esto.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

[EUS] Laurogeita hamarreko hamarkadan, Eusko Jaurlaritzako Berriztapen Pedagogikoaren Zuzendaritzak eta Bartzelonako Unibertsitateko CREA (Gizarte eta Heziketarako Ikerkuntza Zentroa) ikerkuntza-taldeak Ikas Komunitateen proiektua jarri zuten martxan, elkarlanean, Euskal Autonomia Erkidegoko lau zentrotan. Zentro horiek hezkuntza-proiektu berri bat abiatzeko bidea ematen dute; izan ere, porrot akademiko handia izatearren hautatu dira, ikasle-taldeen aniztasunaren egoerari heltzeko arazo ugari dituztelako edota dauden lekuetan gizarte-bazterkeriarekin loturiko arazo anitz daudelako. Aldi berean, proiektuak eraldaketa proposatzen du, bai eskolarena, baita inguruarena ere, eta, horretarako, eskolako partaide guztiak hartzen ditu kontuan. Emaitza onak ikusi ostean, eta, hezkuntza-berriztapenaren alorrean lehentasuna izanik, ekimena zabaltzen hasi zen hastapeneko zentroez bestelako ezaugarri sozioedukatiboak dituzten eskoletara ere. Esperientzia berritzaile horiek aurrera eramateko gogo handiz agertu ziren, baita ere, «praktika on»en paradigma ez zirenak, eta, emaitzei begiratzen badiegu, dirudienez, etekin onak lortzen ari dira zentroetan. Ikas Komunitateen proiektuak berekin daraman gaitasun eraldatzaileak egokitzeko berezko ahala erakusten du. Egokitzapen horretan, eskolaren —inguruarekin batera— eta proiektuaren arteko sinbiosia lortzen da, hezkuntzako arrakasta- ekintzak sustatuz.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

In this work the state of the art of the automatic dialogue strategy management using Markov decision processes (MDP) with reinforcement learning (RL) is described. Partially observable Markov decision processes (POMDP) are also described. To test the validity of these methods, two spoken dialogue systems have been developed. The first one is a spoken dialogue system for weather forecast providing, and the second one is a more complex system for train information. With the first system, comparisons between a rule-based system and an automatically trained system have been done, using a real corpus to train the automatic strategy. In the second system, the scalability of these methods when used in larger systems has been tested.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

This paper deals with the convergence of a remote iterative learning control system subject to data dropouts. The system is composed by a set of discrete-time multiple input-multiple output linear models, each one with its corresponding actuator device and its sensor. Each actuator applies the input signals vector to its corresponding model at the sampling instants and the sensor measures the output signals vector. The iterative learning law is processed in a controller located far away of the models so the control signals vector has to be transmitted from the controller to the actuators through transmission channels. Such a law uses the measurements of each model to generate the input vector to be applied to its subsequent model so the measurements of the models have to be transmitted from the sensors to the controller. All transmissions are subject to failures which are described as a binary sequence taking value 1 or 0. A compensation dropout technique is used to replace the lost data in the transmission processes. The convergence to zero of the errors between the output signals vector and a reference one is achieved as the number of models tends to infinity.