Detailseite
Lernen von Modularen Aktionsrepräsentationen für motorische Fertigkeiten von Robotern
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2014 bis 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 260245577
Das Ziel dieses Projektes ist es ein autonomes Lernsystem zu entwickeln welches sich selbstständig ein reiches Repertoire an Bewegungsfertigkeiten aneignen kann. Die grundlegende Idee hierzu ist, komplexe motorische Aufgaben in einfache, elementare Bewegungen zu zerlegen. Zum Beispiel ein Tennis-Spiel aus vielen einzelnen Schlagbewegungen zusammengesetzt, etwa ein Vorhand oder ein Rückhand-Schlag. Beim Gehen werden andererseits solche elementaren Bewegungen dazu eingesetzt um den Fuß richtig zu platzieren während andere Bewegungsprimitive dazu eingesetzt werden, die Balance zu halten. Wir sehen also dass den meisten motorischen Bewegungsaufgaben eine solche modulare Struktur zu Grunde liegt. Unser Ziel ist es, diese einfache Struktur durch unser Lernsystem ausnutzen zu können. Um das zu bewerkstelligen, muss unser autonomes Lernsystem fähig sein, aus gegebenen Trajektorien die Bewegungsprimitive zu extrahieren, lernen diese auf verschiedene Situationen zu generalisieren, lernen zwischen mehreren Bewegungsprimitiven auszuwählen und Bewegungsprimitive zu kombinieren und zu sequenzieren um komplexes Verhalten aus einfachen Bewegungsbausteinen zu synthetisieren. Unser Lernsystem wird für anfängliches Imitations Lernen sowohl als auch für eine spätere Verbesserung der Fertigkeiten durch Reinforcement Learning anwendbar sein. Das Lernen wird auf mehreren Ebenen der modularen Policy stattfinden. Auf dem höchsten Ebene muss der Agent lernen die Bewegungsbausteine zu aktivieren, die mittlere Ebene muss lernen einen Baustein auf die moementane Situation zu adaptieren und die unterste Ebene übernimmt die eigentliche Kontrolle über den Roboter. Das Lernen auf den verschiedenen Ebenen sowie das Lernen der Struktur und der Interaktion der Ebenen ist darauf abgezielt so wenig menschliche Unterstützung wie möglich zu benötigen. Wir werden unseren Algorithmus auf einer Roboter Tisch-Tennis Applikation evaluieren welche uns viele wichtige Einblicke in die modulare Struktur einer komplexen motorischen Aufgabe liefern wird.
DFG-Verfahren
Schwerpunktprogramme
Teilprojekt zu
SPP 1527:
Autonomes Lernen