Lenovo, die Universität Paderborn und HPC-Partner pro-com DATENSYSTEME planen einen neuen HPC-Cluster.
Lenovo und die Universität Paderborn planen einen neuen HPC-Cluster. Die Integration des neuen Systems wird durch den HPC-Partner pro-com DATENSYSTEME realisiert.
Die Installation ist für die zweite Jahreshälfte geplant. Ab 2025 wird ein Großteil des Rechnersystems im Rahmen des Nationalen Hochleistungsrechnens (NHR) für die bundesweite Forschung bereitgestellt und unterstützt unter anderem den Forschungsschwerpunkt „Atomistische Simulation“. Das HPC-System soll außerdem für alle Forscher der Universität Paderborn und andere Wissenschaftler des Forschungsschwerpunktes aus NRW zugänglich sein. Dem aktuellen Supercomputer Noctua 2 des Paderborn Center for Parallel Computing (PC2) wird damit ein weiteres HPC-System mit etwa doppelter Rechenleistung zur Seite gestellt.
Zum Einsatz kommen unter anderem der Server ThinkSystem SD665 V3 mit der nächsten AMD-Prozessortechnologie bei der CPU-Partition. Für den Bereich der GPU-Nodes ist der ThinkSystem SD665-N V3 Server eingeplant, welcher zusätzlich zu den AMD-CPUs über vier NVIDIA H100 GPUs verfügt. Insgesamt beläuft sich die Gesamtzahl der Kerne auf mehr als 136.000.
Besonderer Fokus liegt dabei auf der Verbesserung der Energieeffizienz. Um eine auf das PC2 zugeschnittene Kühlungslösung zu realisieren, kommt der Coolmanager der deutschen Firma Waning zum Einsatz, der den Anforderungen entsprechend optimiert werden kann. Lenovo selbst setzt auf innovative Technologien, einschließlich der Neptune-Warmwasserkühlung. Mithilfe von warmwassergekühlten Netzteilen und vollständig isolierten Racks können mehr als 97 Prozent der erzeugten Wärme direkt in den Warmwasserkreislauf statt ins Rechenzentrum abgeführt werden. Außerdem ist es dadurch möglich, die eingesetzten Prozessoren durch höhere Wassertemperaturen für eine Leistungssteigerung noch effizienter zu betreiben. Durch Wärmetauscher und CDUs (Coolant Distribution Units) werden Rücklauftemperaturen von über 45 Grad Celsius erreicht, was eine vollständige Freikühlung und eine Abwärmenachnutzung ermöglicht.
Eine weitere Neuerung ist der teilweise Einsatz der Open-Loop-Technik im System von Lenovo, die es in dieser Form in noch keinem anderen System in Deutschland gibt, und die es ermöglicht, die CPUs von den 1U und 2U Standard Servern ebenfalls an eine Wasserkühlung anzuschließen. Neben der verbesserten Energieeffizienz des Gesamtsystems erlaubt dies auch die Verwendung von Hochleistungsprozessoren in Kombination mit FPGA-Beschleunigern. Diese Kühlung der Server kommt auch in der FPGA-Partition des HPC-Systems zum Einsatz.
Als Speichersystem soll eine Lösung auf Basis der IBM ESS 3500 dienen, um eine flexible Verwendung von NVMe und HDD Storage zu erreichen.
Foto: Universität Paderborn, Johanna Pietsch