Neue Commodity Rechnerarchitekturen
Final Report Abstract
Mit NVIDIA-Grafikkarten der Fermi-Architektur (64-bit Rechengenauigkeit und ECC-Speicher) und dem Larrabee-Prozessor von Intel begann das Manycore-Zeitalter mit dem Versprechen höhere Rechenleistung bei geringerem Energieverbrauch liefern zu können. Eingebettet in ein Commodity-Rechencluster wurden drei unterschiedliche, wegweisende Architekturen in der Produktionsumgebung eines universitären Rechenzentrums aus Sicht der Methoden- und Anwendungswissenschaften untersucht: ScaleMP: kohärente Kopplung von Commodity-Rechnern zu einem Shared-Memory-Rechner (512 Cores); Intel Xeon Phi („Knights Corner“): dem Nachfolger des Larrabee–Manycoreprozessors auf x86-Basis; NVIDIA: Grafikprozessoren zur Visualisierung in einer VR-Umgebung sowie für Simulationsrechnungen. Letztere sind das Herz des GPU-Clusters welche die in 2012 beschaffte CAVE ansteuern. Die Forschungsziele, die damit verfolgt wurden, beziehen sich daher auch auf dieses GPU-Cluster. Folgende weitere Aspekte wurden mit Hilfe der beschafften Geräte erforscht und weiterentwickelt: Integration innovativer Architekturen in die Produktionsumgebung eines großen Rechenclusters. Programmierparadigmen für Manycore-Rechner, insbes. die Unterstützung von Akzeleratoren und NUMA-Architekturen durch OpenMP. Werkzeuge zur Performance- und Korrektheitsanalyse für Manycore-Rechner (im VI-HPS). Benchmark-Entwicklung für Manycore-Rechner (SPEC ACCEL). Anwendungen und Einsetzbarkeit dieser neuen Architekturen im Computational Engineering Science. Methoden zum Vergleich von Produktivität und Total Cost of Ownership von Manycore-Rechnern. Der produktive Einsatz innovativer Rechnerarchitekturen, der aufgrund der immensen Energiekosten aktueller Hochleistungsrechnersysteme zukünftig unabdingbar ist, benötigt ein angemessenes Software-Ökosystem, sowie eine adäquate Ausbildung der Anwender. Der theoretische Vorteil dieser Architekturen kann nur bei geeigneter Nutzung realisiert werden. Die Forschungsarbeiten, die die geförderten Geräte ermöglicht haben, haben zu wesentlichen Schritten beigetragen, dieses Ökosystem auszubauen und auch das Wissen darüber zu verbreiten in der Lehre, durch Nutzerschulungen (PPCES), individuelle Nutzerbetreuung, Bedienungsanleitungen, Tutorials auf internationalen Konferenzen (SC, ICS) und Tuning Workshops (aixCelerate, VI-HPS). Die folgenden drei Anwendungsbereiche konnten u.a. von den neuen Architekturen besonders profitieren: Im Rahmen des Verbundprojektes MeProRisk konnte eine neuartige Methodik zur Erfassung der Struktur und der physikalischen Eigenschaften geothermischer Lagerstätten entwickelt werden. Während der Phase der Exploration und der anschließenden Nutzung der geothermischen Lagerstätte erlaubt diese Methodik eine zunehmend bessere Prognose der Bedingungen im Reservoir und damit eine verbesserte Abschätzung des Fündigkeitsrisikos. Die Parallelisierung für das ScaleMP-Cluster mit großem gemeinsamem Speicher eröffnete die Möglichkeit große Simulationsmodelle und gleichzeitig eine große Anzahl an Ensemble-Mitgliedern für stochastische Methoden zu berechnen. Die Lösung von inversen Problemstellungen mithilfe der automatischen Differenzierung zur optimierten Experimentauslegung (OED) und zur inversen Parameterschätzung und Ungenauigkeitsanalyse benötigt einen erhöhten Aufwand an Rechenzeit und Speicher. Im Rahmen des Exzellenzclusters 236 konnten im Institut für Technische Verbrennung Turbulenzeigenschaften mit einer neuen Methode statistisch erfasst werden. Turbulenz zeichnet sich u.a. durch unvorhersehbare plötzliche Änderungen zugrundeliegender Vektor- und Skalarfelder aus. Das Zerlegen der Felder in kleinere raumfüllende Strukturen mit einem rechen- und speicherintensiver Verfahren wurde durch das ScaleMP-Clusters ermöglicht bei dem alle Prozessoren Zugriff auf den großen gemeinsamen Speicher besitzen. Am Lehrstuhl für Experimentelle Molekulare Bildgebung wurde für mehrere umfangreiche biomedizinische Studien GPU-beschleunigter Code für Rekonstruktionsmethoden zur multimodalen dreidimensionalen Fluoreszenztomographie implementiert und damit Ergebnisse erzielt, die mit herkömmlichen Rechnerarchitekturen nicht in angemessener Zeit möglich gewesen wären. In mehreren Projekten wurden innovative Tumorbehandlungskonzepte untersucht, fluoreszente Sonden zur Charakterisierung der Leberentzündung entwickelt, der Effekt der Epo-Therapie auf das Tumorwachstum, die Wirkstoffanreicherung langzirkulierender Nanowirkstoffe in Tumoren und die Anreicherung von Wirkstoffen im Tumor aufgrund durchlässiger Tumorgefäße erforscht, sowie die Verwendung von Hardwarebeschleunigern für die Gradientenberechnung mittels Algorithmischer Differenzierung evaluiert.
Publications
- A Pattern-Based Comparison of OpenACC and OpenMP for Accelerator Computing. Lecture Notes in Computer Science, Springer
Sandra Wienke, Christian Terboven, James C. Beyer, Matthias S. Müller
(See online at https://doi.org/10.1007/978-3-319-09873-9_68) - Accelerators for Technical Computing: Is It Worth the Pain? A TCO Perspective Lecture Notes in Computer Science, Springer
Sandra Wienke, Dieter an Mey, Matthias S. Müller
(See online at https://doi.org/10.1007/978-3-642-38750-0_25) - SPEC ACCEL: A Standard Application Suite for Measuring Hardware Accelerator Performance. Lecture Notes in Computer Science, Springer
Guido Juckeland, William Brantley, Sunita Chandrasekaran, Barbara Chapman, Shuai Che, Mathew Colgrove, Huiyu Feng, Alexander Grund, Robert Henschel, Wen-Mei W. Hwu, Huian Li, Matthias S. Müller, Wolfgang E. Nagel, Maxim Perminov, Pavel Shelepugin, Kevin Skadron, John Stratton, Alexey Titov, Ke Wang, Matthijs van Waveren, Brian Whitney, Sandra Wienke, Rengan Xu, Kalyan Kumaran
(See online at https://doi.org/10.1007/978-3-319-17248-4_3) - Trajectory-Search on ScaleMP's vSMP Architecture IOS Press - Advances in Parallel Computing
Nicolas Berr, Dirk Schmidl, Jens Henrik Göbbert, Stefan Lankes, Dieter an Mey, Thomas Bemmerl
(See online at https://doi.org/10.3233/978-1-61499-041-3-227) - Gradient trajectory analysis in a jet flow for turbulent combustion modelling. Journal of Turbulence, Volume 14, Issue 1, 2013
Gampert, M., Schaefer, P., Naranaswamy, V. and Peters, N.
(See online at https://doi.org/10.1080/14685248.2012.747688) - Modeling contribution to risk assessment of thermal production power for geothermal reservoirs. ScienceDirect, Renewable Energy, vol. 52, pp.230-241, May 2013
C. Vogt, K. Iwanowski-Strahser, G. Marquart, Katja Iwanowski- Strahser, Gabriele Marquart, Juliane Arnold, Darius Mottaghy, Renate Pechnig, Daniel Gnjezda, Christoph Clauser
(See online at https://doi.org/10.1016/j.renene.2012.11.026) - Hybrid µCT-FMT imaging and image analysis. J Vis Exp, no. 100, p. e52770, 2015
F. Gremse, D. Doleschel, S. Zafarnia, A. Babler, W. Jahnen- Dechent, T. Lammers, W. Lederle, and F. Kiessling
(See online at https://doi.org/10.3791/52770) - GPU-Accelerated Adjoint Algorithmic Differentiation. Comput Phys Commun, vol. 200, pp. 300–311, Mar. 2016
F. Gremse, A. Höfter, L. Razik, F. Kiessling, and U. Naumann
(See online at https://doi.org/10.1016/j.cpc.2015.10.027) - Optimal experimental design for reservoir property estimates in geothermal exploration. Computational Geosciences, 2(2):357-383, 2016
R. Seidler, K. Padalkina, H. M. Bücker, A. Ebigbo, M. Herty, G. Marquart, and J. Niederau
(See online at https://doi.org/10.1007/s10596-016-9565-4)