Detailseite
Konvexe Online-Optimierung zur Regelung dynamischer Systeme
Antragsteller
Professor Dr.-Ing. Matthias Müller
Fachliche Zuordnung
Automatisierungstechnik, Mechatronik, Regelungssysteme, Intelligente Technische Systeme, Robotik
Förderung
Förderung seit 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 505182457
Konvexe Online-Optimierung (Englisch: online convex optimization; OCO) wurde ursprünglich im Bereich des maschinellen Lernens zur Online-Optimierung a priori unbekannter und zeitveränderlicher Kostenfunktionen entwickelt. Bei diesem Verfahren wird zu jedem Zeitschritt eine Aktion ausgewählt, wobei nur vorherige Kostenfunktionen und Aktionen bekannt sind. Erst nachdem eine Aktion ausgewählt wurde, wird die aktuelle Kostenfunktion von der Umgebung offen gelegt. Ziel der OCO-Strategie ist es, die kumulierten Kosten über einen endlichen Zeithorizont zu minimieren. Zu den Vorteilen dieses Verfahrens gehören die Anwendbarkeit für a priori unbekannte und zeitvariante Kosten (wie z.B. zeitveränderliche Energiepreise) sowie die Möglichkeit, bekannte Schranken an die zulässigen Aktionen zu berücksichtigen. Zusätzlich sind OCO-Algorithmen im Allgemeinen recheneffizient, weil sie das Optimierungsproblem nicht explizit lösen. Stattdessen wird zu jedem Zeitschritt eine Iteration eines geeigneten Optimierungsverfahrens (z.B. Gradientenabstieg) angewandt. Diese Vorteile von OCO sind äußerst wünschenswert für die Regelung dynamischer Systeme, weshalb in unserer (und anderen) Forschungsgruppen kürzlich erste Regelungsmethoden entwickelt wurden, die auf OCO basieren. Performance- und Stabilitätsgarantien für diese Algorithmen benötigen allerdings restriktive Annahmen und begrenzen ihre Anwendbarkeit auf die Stabilisierung a priori unbekannter und zeitvarianter Sollwerte oder vernachlässigen Nebenbedingungen an die Stellgröße oder die Systemzustände. Das Hauptziel dieses Projekts ist die Entwicklung von auf OCO basierenden Regelungsmethoden für allgemeine Kostenfunktionen und Nebenbedingungen, die ohne restriktive Annahmen auskommen. Dafür werden wir Methoden analysieren, die OCO direkt zur Regelung dynamischer Systeme anwenden, sowie OCO mit etablierten Regelungsverfahren kombinieren, wie zum Beispiel mit reference governors oder der modellprädiktiven Regelung (Englisch: model predictive control; MPC). Wir werden die spezifischen Vorteile dieser Verfahren sowie die resultierenden Eigenschaften des geschlossenen Regelkreises untersuchen. Des Weiteren sollen kürzlich gewonnene Einsichten aus dem OCO-Kontext genutzt werden, um den ''regret" (ein Maß für die erzielte Performance, das typischerweise in OCO verwendet wird) von allgemeinen MPC-Algorithmen im Kontext a priori unbekannter und zeitveränderlicher Kostenfunktionen zu analysieren.
DFG-Verfahren
Sachbeihilfen