ENVELOPE - Effizienz und Zuverlässigkeit: Selbstorganisation in HPC-Systemen

 

"ENVELOPE - Effizienz und Zuverlässigkeit: Selbstorganisation in HPC-Systemen" ist ein vom BMBF gefördertes Projekt im Rahmen des Förderprogramms "IKT 2020 - Forschung für Innovationen“ auf dem Gebiet "Grundlagenorientierte Forschung für HPC-Software im Hoch- und Höchstleistungsrechnen“. Das Projekt hat eine Laufzeit von 3 Jahren und startete im Januar 2017.

 

Weitere Informationen

Kontakt

Name

Jonathan Klimt

Team Simulation Infrastructure and HPC

Telefon

work
+49 241 80 49711

E-Mail

E-Mail

Kontakt

Name

Maliheh Haghgoo

Team Energy Management Systems and Data Analytics

Telefon

work
+49 241 80 49587

E-Mail

E-Mail
 

ENVELOPE hat zum Ziel die Effizienz und Zuverlässigkeit in heterogenen HPC-Systemen zu erhöhen. Hierzu greift es auf die Mittel systemunabhängiger Selbstorganisation zurück. Entscheidend hierbei ist das Zusammenspiel der Betrachtung des Systems auf Knotenebene, einer globalen Sichtweise auf das System, sowie Techniken auf der Anwendungsebene. Die steigende Anzahl an Knoten und damit einhergehend der Komponenten in HPC-Systemen führt unweigerlich zu einer Erhöhung der Wahrscheinlichkeit eines Komponentenausfalls. Daher spielt die Zuverlässigkeit eine entscheidende Rolle in zukünftigen HPC-Systemen, welche nicht durch klassische Methoden aufgrund ihrer enormen Kosten und des Ressourcenverbrauchs gewährleistet werden kann. Deshalb verfolgt ENVELOPE einen Weg, der klassische Methoden (wie z.B. die Aufnahme regelmäßiger Sicherungspunkte) mit einer proaktiven Erkennung von Komponentenausfällen kombiniert. So können im voraus, und nur wenn tatsächlich notwendig, Maßnahmen für die Sicherstellung eines korrekten Anwendungsablaufs ergriffen werden. Die entstehende Komplexität im Umgang mit heterogenen Systeme ist dabei vor dem Anwendungsprogrammierer zu verbergen.

Das ACS beschäftigt sich im Rahmen von ENVELOPE hauptsächlich mit der Umsetzung einer proaktiven Migration von Prozessen auf Basis von Containerlösungen. Diese soll mit bestehenden Mechanismen zur Aufnahme von Sicherungspunkten kombiniert werden um die Kosten für eine tatsächliche Verschiebung der Prozesse so gering wie möglich zu halten und gleichzeitig einen Neustart der Anwendung auf Basis eines zuvor aufgenommenen Sicherungspunktes zu ermöglichen, falls die Migration nicht rechtzeitig abgeschlossen werden konnte.

  Gefördert vom BMBF
 
 

Newsmeldungen

 
26.03.2019

Am 26. und 27. März findet das Konsortialtreffen des ENVELOPE-Projekts statt, in dem die aktuellen Forschungsergebnisse präsentiert werden.

 
08.10.2018

Am 8.10.2018 präsentierte Dr. Lankes in Erlangen die ersten Ergebnisse des Envelope-Projekts auf der HPC-Statustagung der Gauß-Allianz.