Biblioteca Digital

5 resultados para Coordination games

em Universitat de Girona, Spain

An hybrid methodology for RL-based behavior coordination in a target following mission with an AUV

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Proposes a behavior-based scheme for high-level control of autonomous underwater vehicles (AUVs). Two main characteristics can be highlighted in the control scheme. Behavior coordination is done through a hybrid methodology, which takes in advantages of the robustness and modularity in competitive approaches, as well as optimized trajectories

Veja mais

Hybrid coordination of reinforcement learning-based behaviors for AUV control

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This paper proposes a hybrid coordination method for behavior-based control architectures. The hybrid method takes advantages of the robustness and modularity in competitive approaches as well as optimized trajectories in cooperative ones. This paper shows the feasibility of applying this hybrid method with a 3D-navigation to an autonomous underwater vehicle (AUV). The behaviors are learnt online by means of reinforcement learning. A continuous Q-learning implemented with a feed-forward neural network is employed. Realistic simulations were carried out. The results obtained show the good performance of the hybrid method on behavior coordination as well as the convergence of the behaviors

Veja mais

A Multi-agent Architecture with Distributed Coordination for an Autonomous Robot

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Aquest treball proposa una nova arquitectura de control amb coordinació distribuïda per a un robot mòbil (ARMADiCo). La metodologia de coordinació distribuïda consisteix en dos passos: el primer determina quin és l'agent que guanya el recurs basat en el càlcul privat de la utilitat i el segon, com es fa el canvi del recurs per evitar comportaments abruptes del robot. Aquesta arquitectura ha estat concebuda per facilitar la introducció de nous components hardware i software, definint un patró de disseny d'agents que captura les característiques comunes dels agents. Aquest patró ha portat al desenvolupament d'una arquitectura modular dins l'agent que permet la separació dels diferents mètodes utilitzats per aconseguir els objectius, la col·laboració, la competició i la coordinació de recursos. ARMADiCo s'ha provat en un robot Pioneer 2DX de MobileRobots Inc.. S'han fet diversos experiments i els resultats han demostrat que s'han aconseguit les característiques proposades per l'arquitectura.

Veja mais

Dynamic task allocation and coordination in cooperative multi-agent environments

Relevância:

20.00% 20.00%

Publicador:

Resumo:

La coordinació i assignació de tasques en entorns distribuïts ha estat un punt important de la recerca en els últims anys i aquests temes són el cor dels sistemes multi-agent. Els agents en aquests sistemes necessiten cooperar i considerar els altres agents en les seves accions i decisions. A més a més, els agents han de coordinar-se ells mateixos per complir tasques complexes que necessiten més d'un agent per ser complerta. Aquestes tasques poden ser tan complexes que els agents poden no saber la ubicació de les tasques o el temps que resta abans de que les tasques quedin obsoletes. Els agents poden necessitar utilitzar la comunicació amb l'objectiu de conèixer la tasca en l'entorn, en cas contrari, poden perdre molt de temps per trobar la tasca dins de l'escenari. De forma similar, el procés de presa de decisions distribuït pot ser encara més complexa si l'entorn és dinàmic, amb incertesa i en temps real. En aquesta dissertació, considerem entorns amb sistemes multi-agent amb restriccions i cooperatius (dinàmics, amb incertesa i en temps real). En aquest sentit es proposen dues aproximacions que permeten la coordinació dels agents. La primera és un mecanisme semi-centralitzat basat en tècniques de subhastes combinatòries i la idea principal es minimitzar el cost de les tasques assignades des de l'agent central cap als equips d'agents. Aquest algoritme té en compte les preferències dels agents sobre les tasques. Aquestes preferències estan incloses en el bid enviat per l'agent. La segona és un aproximació d'scheduling totalment descentralitzat. Això permet als agents assignar les seves tasques tenint en compte les preferències temporals sobre les tasques dels agents. En aquest cas, el rendiment del sistema no només depèn de la maximització o del criteri d'optimització, sinó que també depèn de la capacitat dels agents per adaptar les seves assignacions eficientment. Addicionalment, en un entorn dinàmic, els errors d'execució poden succeir a qualsevol pla degut a la incertesa i error de accions individuals. A més, una part indispensable d'un sistema de planificació és la capacitat de re-planificar. Aquesta dissertació també proveeix una aproximació amb re-planificació amb l'objectiu de permetre als agent re-coordinar els seus plans quan els problemes en l'entorn no permeti la execució del pla. Totes aquestes aproximacions s'han portat a terme per permetre als agents assignar i coordinar de forma eficient totes les tasques complexes en un entorn multi-agent cooperatiu, dinàmic i amb incertesa. Totes aquestes aproximacions han demostrat la seva eficiència en experiments duts a terme en l'entorn de simulació RoboCup Rescue.

Veja mais

New Ruthenium complexes containing N, P and S-donor type of ligands: coordination chemistry, characterization and application to asymetric and non-asymetric catalysis

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Síntesi de nous complexos de Ruteni amb lligands no quirals que tenen per fórmula [Ru(phen)([9]aneS3)X] (on X = H2O, py i MeCN). Caracterització espectroscòpica electroquímica i estructural d'aquesta família de complexos. Estudi de les seves propietats catalítiques en front a l'oxidació de substrats orgànics com l'alcohol benzílic en reaccions d'electrocatàlisi. Avaluació cinètica dels mecanismes de substitució entre els complexos Ru-py i Ru-MeCN. Generació d'un interruptor molecular foto-induït. Síntesi de nous complexos quirals de Ru atropoisomèricament purs amb lligands oxazolínics que tenen per fórmula [Ru(trpy)(Ph-box-R)X] on (X = Cl, H2O, py, MeCN, 2-OH-py). Caracterització estructural exhaustiva en estat sòlid (Raig-X) en solució (RMN) i en fase gas (càlculs DFT). Avaluació de la seva activitat catalítica en reaccions asimmetriques d'epoxidació de substrats proquirals. Síntesi de nous lligands polipiridílics quirals amb simetria C3. Estudi de la seva química de coordinació i avaluació de la seva activitat catalítica en reaccions asimmetriques d'oxidació i reducció.

Veja mais

5 resultados para Coordination games

em Universitat de Girona, Spain

Filtro por publicador

An hybrid methodology for RL-based behavior coordination in a target following mission with an AUV

Hybrid coordination of reinforcement learning-based behaviors for AUV control

A Multi-agent Architecture with Distributed Coordination for an Autonomous Robot

Dynamic task allocation and coordination in cooperative multi-agent environments

New Ruthenium complexes containing N, P and S-donor type of ligands: coordination chemistry, characterization and application to asymetric and non-asymetric catalysis