Detailseite
FOR 1306: Stratosphere - Information Management on the Cloud
Fachliche Zuordnung
Informatik, System- und Elektrotechnik
Förderung
Förderung von 2010 bis 2019
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 132320961
Forschung und Wirtschaft produzieren immer größere Datenmengen (Transaktionsdaten, Texte, Messungen etc.), deren schnelle Analyse für viele Anwendungen unabdingbar ist. In Anbetracht des Datenvolumens ist es dabei notwendig, die Verarbeitung auf mehrere Rechner zu verteilen. In dieser Forschergruppe untersuchen Informatikerinnen und Informatiker mehrerer Universitäten aus Berlin und Potsdam neue Methoden, um die Rechenkraft großer Computer-Cluster einfacher für komplexe Analyseaufgaben nutzbar machen. Die dabei entwickelten Technologien werden es auch Anwendern, die keine eigenen Rechenzentren besitzen, ermöglichen, kostengünstig komplexe Analysen sehr großer Datenbestände durchzuführen. Im Fokus des Projekts stehen die Untersuchung eines geeigneten Programmiermodells, die Entwicklung einer massiv-parallelen, adaptiven und robusten Ausführungsumgebung sowie die einfache Integration benutzerdefinierter Analyseverfahren. Konkrete Anwendungsfälle behandeln die Analyse von Klimasimulationen, Linked Open Data und die Analyse von biomedizinischen Texten. Die Technologien, die in der Forschergruppe entwickelt werden, werden der Forschungsgemeinde als Open Source zur Verfügung gestellt.
DFG-Verfahren
Forschungsgruppen
Projekte
- A Library for Scalable Analytics and Mining in Stratosphere (Antragsteller Naumann, Felix )
- A Scalable, Massively-Parallel Runtime System with Predictable Performance (Antragsteller Kao, Odej )
- Compiling and Optimizing Iterative Data Analysis Programs with Shared State on Evolving Datasets (Antragsteller Markl, Volker )
- Continuous Query Re-Optimization in Stratosphere (Antragsteller Freytag, Ph.D., Johann-Christoph )
- Coordination (Antragsteller Markl, Volker )
- Data Profiling and Data Cleansing on Stratosphere (Antragsteller Naumann, Felix )
- Massively Parallel, Adaptive and Fault-Tolerant Execution of Data Flow Programs on Dynamic Clouds (Antragsteller Kao, Odej )
- Scalable Information Extraction in Stratosphere (Antragsteller Leser, Ulf )
- Stratosphere Data and Processing Model, its Optimization and Parallelization (Antragsteller Markl, Volker )
- Uncertainty and Data Cleansing in the Stratosphere Cloud Data Management System (Antragsteller Naumann, Felix )
- Web Data Analytics and Scientific Workflows (Antragsteller Leser, Ulf )
Sprecher
Professor Dr. Volker Markl