Ein besonderer Fokus des Systems liegt auf der Verarbeitung gigantischer Datenmengen. Erreicht wurde dies durch die Installation des Moduls JURECA-DC – “DC” steht für “data-centric” –, das von der französischen Firma Atos geliefert wurde und mit dem Betriebssystem der deutschen Firma ParTec arbeitet. Stand heute gehörte allein dieses neue Modul mit seinen 18,5 Petaflops zu den aktuell 30 schnellsten Supercomputern der Welt. Es wird wie der modulare Jülicher Superrechner JUWELS, derzeit schnellster Rechner Europas, auf der aktualisierten TOP500-Liste der leistungsfähigsten Computer der Welt erscheinen, die am 28. Juni auf der ISC21 Digital bekanntgegeben wird. Zusätzlich wurde mit dem innovativen Flash-Speicher JUST-IME von HPE und DDN ein Speichersystem installiert, von dem mehrere Jülicher Superrechner profitieren.
Die Menge an Daten nimmt stetig exponentiell zu, sowohl in der Wissenschaft, als auch in der Industrie. Gut beobachten lässt sich das in der Klimaforschung, etwa anhand neuer, datenintensiver Techniken der Datenassimilation, die genauere Vorhersagen zum Klimawandel ermöglichen. Bei der Methode geht es darum, Daten aus Computersimulationen mit realen Messdaten zu verknüpfen. Ein weiteres Beispiel sind Wetterprognosen mittels Deep Learning. Diese nutzen Muster, die aus gigantischen Datensätzen extrahiert werden, um die Vorhersage von lokal auftretenden Gewittern und starken Regenfällen zu verbessern.
Die Erneuerung und Erweiterung der Rechner-Infrastruktur am Jülich Supercomputing Centre (JSC) trägt der Entwicklung zu datengetriebenen Ansätzen Rechnung und ermöglicht es Forschenden nun, so große Datenmengen zu verarbeiten wie nie zuvor. Ergänzend zum „datenzentrierten“ JURECA-DC-Modul wurde das zentrale Speichercluster JUST um ein eines Flash-Speichersystem von HPE und DDN erweitert: Damit gehen am JSC gleich zwei neue Systeme in Betrieb, die darauf zugeschnitten sind, die Verarbeitung von Daten zu beschleunigen und Wissen aus riesigen Datenbergen zu generieren.
Der Superrechner JURECA besteht aus zwei Modulen: ein Cluster-Modul, das universell einsetzbar ist, sowie ein Booster-Modul für spezielle Codes und rechenintensive Programmteile, die sich sehr effizient parallel auf einer Vielzahl von Rechenkernen berechnen lassen. Das Cluster-Modul wurde in den letzten Monaten durch das JURECA-DC-Modul ersetzt. Das JURECA-Booster-Modul wurde erst 2017 installiert und bleibt weiter im Betrieb.
Das neue JURECA-DC-Modul, das im Mai vollständig in Betrieb ging, wurde von Atos geliefert und basiert auf der Sequana-XH2000-Reihe. Es besteht aus insgesamt 768 Rechenknoten, die mit zwei AMD-EPYC-Rome-CPUs mit 64 Kernen und 512 GB bis 1 TB Hauptspeicher bestückt sind. Jeder einzelne Rechenknoten verfügt damit über einen Arbeitsspeicher, der von der Kapazität her der gesamten Festplatte in einem gewöhnlichen PC entspricht. Ein neuartiges innovatives Flash-Speichersystem von Atos trägt zusätzlich dazu bei, datenintensive Anwendungen – ähnlich wie mit einer Solid-State-Disk in einem Notebook oder PC – zu beschleunigen. In einem gemeinsamen Projekt arbeiten das Forschungszentrum Jülich, Atos und ParTec daran, das System in seiner frühen Produktionsphase schrittweise weiter zu optimieren.
Insgesamt 192 der 768 Knoten sind mit je vier Tensor-Core-Grafikprozessoren (GPUs) vom Typ NVIDIA A100 ausgestattet. Die immense Rechenpower dieser Grafikprozessoren ist der wesentliche Grund, warum sich die Rechenleistung des neuen Moduls im Vergleich zum Vorgänger um beinahe eine Größenordnung erhöht hat. Von den GPU-beschleunigten Rechenknoten profitieren beispielsweise Anwendungen des maschinellen Lernens, wie sie bei der Analyse und Verarbeitung von hochaufgelösten Bilddaten in der Hirnforschung zum Einsatz kommen.
Das JURECA-DC-Modul wurde im Rahmen des PPI4HPC-Projekts beschafft, in dem sich Rechenzentren aus vier europäischen Ländern zusammengeschlossen haben, um – erstmals auf europäischer Ebene – in einem gemeinsamen Verfahren neue innovative Superrechner-Systeme zu erwerben. Die EU fördert den Prozess der sogenannten Innovativen Öffentlichen Beschaffung (PPI), indem sie 35 Prozent der anfallenden Kosten übernimmt und dafür einen Teil der Rechenzeit für europäische Wissenschaftlerinnen und Wissenschaftler nutzbar machen kann. Neben dem JSC sind das BSC in Spanien, GENCI/CEA in Frankreich und CINECA in Italien an PPI4HPC beteiligt.
JUST-IME: Datenturbo für zentrales Speichersystem
Mit dem Flash-Speichersystem JUST-IME kommt am zentralen Jülicher Speicherserver JUST ein neuer Hochleistungsspeicher für das schnelle Ein- und Auslesen von Daten hinzu, der ebenfalls geeignet ist, die Analyse von Daten und maschinelles Lernen zu beschleunigen. Das Modul wurde von Hewlett Packard Enterprise und DDN geliefert und ist mit den Superrechnern JUWELS, JURECA und JUSUF vernetzt. Zusammen erreichen diese dank „Infinite Memory Engine“-Technologie von DDN eine Bandbreite von über 2 TB/s – das entspricht ungefähr der doppelten Bandbreite des Transatlantikkabels TAT-14, das seit 2001 zwischen den USA und Deutschland liegt.
Das Speichersystem wurde, wie bereits der Superrechner JUSUF in 2020, im Rahmen des EU-Projekts ICEI als Teil der Infrastruktur Fenix angeschafft, die die großen europäischen Supercomputing-Zentren BSC in Spanien, CEA in Frankreich, JSC in Deutschland, CSCS in der Schweiz und CINECA in Italien gemeinsam betreiben.