Detailseite
OptSCORE: Selbstoptimierte Effizienz, Sicherheit und Robustheit für aktive Replikation
Antragsteller
Professor Dr.-Ing. Franz J. Hauck; Professor Dr. Hans P. Reiser
Fachliche Zuordnung
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung
Förderung von 2015 bis 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 268730775
Die reibungslose Funktion von IT-Systemen ist für die heutige Gesellschaft in vielen Bereichen unerlässlich. Vernetzte Systeme sind mit hohen Anforderungen in Bezug auf Zuverlässigkeit und Sicherheit konfrontiert. Replikation von Diensten ist ein grundlegender Mechanismus, der dazu beiträgt, diesen Anforderungen gerecht zu werden. Trends wie Cloud Computing, miteinander gekoppelte serviceorientierte Architekturen, sowie Mehrkern-CPUs konfrontieren dabei etablierte Replikationslösungen durch ihre hochgradige Parallelität und hohe Dynamik mit neuen Herausforderungen.Ziel des Projekts OptSCORE ist es, für diese Herausforderungen neue Lösungen zu finden. Im Mittelpunkt steht dabei als Basistechnik die Replikation von Zustandsmaschinen (State Machine Replication - SMR). Mittels SMR replizierte Dienste ermöglichen eine hohe Verfügbarkeit bei starker Konsistenz der Replikate und haben das Potenzial nicht nur Ausfälle sondern auch beliebige (Byzantinische) Fehler zu tolerieren.Nachdem in einer ersten Projektphase Konfigurationsparameter für das deterministische Scheduling und die Gruppenkommunikation ermittelt und untersucht wurden, ist nun das Ziel für eine gegebene Anwendung und Ausführungsumgebung die beste Konfiguration automatisch zu ermitteln, so dass Durchsatz und/oder Antwortzeit optimal ausfallen. Die Herausforderung besteht hier in der Komplexität der möglichen Parameterkonfigurationen und deren Abhängigkeiten. Neben klassischen Ansätzen der kombinatorischen Parameteroptimierung ist geplant, maschinelles Lernen zur Findung optimaler Konfigurationen einzusetzen. Optimale Konfigurationen sollen vom System selbst dynamisch gefunden und zur Laufzeit eingenommen werden können.Darüber hinaus soll die bekannte Fehlermaskierung in SMR-Systemen mit einer Einbruchserkennung verknüpft werden, um geeignete Fehlerbehebungsmaßnahmen insbesondere in byzantinisch fehlertolerante Systeme zu integrieren. Neben einer umfassenden Sicherheitsanalyse auch für Angriffe auf die oben erwähnte Optimierungsarchitektur sollen geeignete Maßnahmen zur Verhinderung der identifizierten Angriffe erforscht werden.Verschiedene weitere Optimierungsansätze ergänzen das Projekt. Insbesondere sollen folgende Fragestellungen untersucht und gelöst werden: Lassen sich durch CRDTs und nur partiell statt total geordnete Multicasts Verbesserungen in der Leistungsfähigkeit erzielen ohne die strenge Konsistenz von SMR-Systemen aufzugeben? Wie kann verhindert werden, dass ein langsames Replikat ein SMR-System ausbremst? Wie lässt sich das notwendige Checkpointing mit der nebenläufigen Ausführung von Aufträgen effizient verknüpfen?Mit den erwarteten Resultaten trägt dieses Projekt erheblich dazu bei, hochverfügbare und zuverlässige Dienste effizienter und einfacher konfigurierbar zu machen.
DFG-Verfahren
Sachbeihilfen