2 resultados para articulated motion structure learning

em ArchiMeD - Elektronische Publikationen der Universität Mainz - Alemanha


Relevância:

30.00% 30.00%

Publicador:

Resumo:

Die vorliegende Arbeit beschaeftigt sich mit der Untersuchung vonPolymeren mit intrinsischer Steifigkeit. Es werden vor allem lokale statische unddynamische Eigenschaften anhand zweier verschiedener Simulationsmodellebetrachtet: Ein generisches Polymermodell, bei dem nur dieSteifigkeit als ein das spezifische Polymer charakterisierenden Parametereingeht und ein atomistisches Modell fuer trans-Polyisopren. Mit Hilfe des ersten Modells koennen Statik und Dynamik wurmartiger Kettenbeobachtet werden. Das Blob-Konzept ist eine angemessene statischeBeschreibung. Lokale Orientierungen haengen schwach von derSteifigkeit ab. Das Reptationsmodell kann die beobachtete Dynamik fuer lange Kettennicht mehr angemessen beschreiben. Lange Ketten bewegen sich, als obsie in Roehren gezwaengt waeren; jedoch ist die Bewegung starkabhaengig von der Steifigkeit. Fuer Ketten dieser Art konntequalitativ das Verhalten reproduziert werden, das in NMR-Experimentenbeobachtet wird. Eine Verhakungslaenge laesst sich fuer solche Kettenkaum mehr definieren. Dynamische Strukturfunktionen und insbesonderedie direkte Visualisierung der Ketten verdeutlichen die effektiv aufeine Roehre beschraenkte Bewegung. Das atomistische Polyisoprenmodell wurde mit verschiedenen Experimenten,verglichen. In den Simulationen bei konnten qualitativ undsemiquantitativ experimentelle Ergebnisse reproduziert werden. Zuletzt wurden die Laengen- und Zeitskalen der beiden Modelleerfolgreich aufeinander abgebildet.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Die vorliegende Arbeit beschäftigt sich mit der Entwicklung eines Funktionsapproximators und dessen Verwendung in Verfahren zum Lernen von diskreten und kontinuierlichen Aktionen: 1. Ein allgemeiner Funktionsapproximator – Locally Weighted Interpolating Growing Neural Gas (LWIGNG) – wird auf Basis eines Wachsenden Neuralen Gases (GNG) entwickelt. Die topologische Nachbarschaft in der Neuronenstruktur wird verwendet, um zwischen benachbarten Neuronen zu interpolieren und durch lokale Gewichtung die Approximation zu berechnen. Die Leistungsfähigkeit des Ansatzes, insbesondere in Hinsicht auf sich verändernde Zielfunktionen und sich verändernde Eingabeverteilungen, wird in verschiedenen Experimenten unter Beweis gestellt. 2. Zum Lernen diskreter Aktionen wird das LWIGNG-Verfahren mit Q-Learning zur Q-LWIGNG-Methode verbunden. Dafür muss der zugrunde liegende GNG-Algorithmus abgeändert werden, da die Eingabedaten beim Aktionenlernen eine bestimmte Reihenfolge haben. Q-LWIGNG erzielt sehr gute Ergebnisse beim Stabbalance- und beim Mountain-Car-Problem und gute Ergebnisse beim Acrobot-Problem. 3. Zum Lernen kontinuierlicher Aktionen wird ein REINFORCE-Algorithmus mit LWIGNG zur ReinforceGNG-Methode verbunden. Dabei wird eine Actor-Critic-Architektur eingesetzt, um aus zeitverzögerten Belohnungen zu lernen. LWIGNG approximiert sowohl die Zustands-Wertefunktion als auch die Politik, die in Form von situationsabhängigen Parametern einer Normalverteilung repräsentiert wird. ReinforceGNG wird erfolgreich zum Lernen von Bewegungen für einen simulierten 2-rädrigen Roboter eingesetzt, der einen rollenden Ball unter bestimmten Bedingungen abfangen soll.