ADMIN

2026

01

2025-12-29T12:00:00

Infrastruktur und Rechenzentrum

SCHWERPUNKT

056

Rechenzentrum

Infrastruktur

Kühltechnologien für KI-Rechenzentren

Ins kalte Wasser springen

von Ariane Rüdiger

Veröffentlicht in Ausgabe 01/2026 - SCHWERPUNKT

KI-Workloads holen immer mehr GPUs ins Rechenzentrum – und mit ihnen enorme Leistungsdichten. Klassische Luftkühlung kommt dabei schnell an Grenzen. Dieser Beitrag zeigt, welche Flüssigkühlverfahren sich für GPU-basierte KI-Systeme eignen, wie sie sich nachrüsten lassen und welche Technologien kurz vor dem Praxiseinsatz stehen.

Künstliche Intelligenz, maschinelles Lernen und neuronale Netze haben mindestens zwei Dinge gemeinsam – sie erleben einen gewaltigen Hype und sie treiben den Energiebedarf im Rechenzentrum kräftig nach oben. Der Weltmarkt für KI erreichte 2025 laut Statista rund 244 Milliarden Dollar. Bis 2031 soll er jährlich um 26 Prozent wachsen, größter Markt sind die USA mit knapp 74 Milliarden Dollar. Andere Quellen nennen leicht abweichende Zahlen, doch der Trend ist eindeutig: Er zeigt steil nach oben. Unternehmen, die nicht mitziehen, müssen laut Marktauguren mit einem baldigen Wettbewerbsnachteil rechnen. Früher oder später werden sich daher viele Firmen mit der Frage beschäftigen müssen, wie sie KI-Infrastruktur sinnvoll integrieren. Das betrifft besonders Provider aller Größenordnungen, die ihren Kunden entsprechende Hardware oder Algorithmen zur Miete anbieten möchten.
Die GPU als Stromfresser
KI-Hardware zwingt die heute meist luftgekühlten Systeme zur Anpassung. Vor allem GPUs treiben die Leistungsaufnahme in ungeahnte Höhen. Dabei ist zwischen dem Thermal Design Point (TDP) und der Spitzenleistung zu unterscheiden. Der TDP beschreibt jene Dauerlast, bei der das System zuverlässig unterhalb der maximal zulässigen Temperatur bleibt. In der Praxis treten jedoch regelmäßig Leistungsspitzen auf, die die Maximaltemperatur über längere Zeiträume überschreiten.
Die TDP-Werte aktueller GPU-Modelle liegen inzwischen im hohen drei- und sogar vierstelligen Wattbereich. Werden – technisch problemlos – 168 GPUs in einem Rack verbaut, entstehen Leistungsaufnahmen im Bereich mehrerer hundert Kilowatt. Ein Beispiel: NVIDIAs Blackwell Ultra liegt bei 1400 W, sein Vorgänger bei 1200 W. Der H100 kam noch mit 700 W aus. Auch AMD bildet keine Ausnahme; der MI355X liegt bei 1100 W.
Künstliche Intelligenz, maschinelles Lernen und neuronale Netze haben mindestens zwei Dinge gemeinsam – sie erleben einen gewaltigen Hype und sie treiben den Energiebedarf im Rechenzentrum kräftig nach oben. Der Weltmarkt für KI erreichte 2025 laut Statista rund 244 Milliarden Dollar. Bis 2031 soll er jährlich um 26 Prozent wachsen, größter Markt sind die USA mit knapp 74 Milliarden Dollar. Andere Quellen nennen leicht abweichende Zahlen, doch der Trend ist eindeutig: Er zeigt steil nach oben. Unternehmen, die nicht mitziehen, müssen laut Marktauguren mit einem baldigen Wettbewerbsnachteil rechnen. Früher oder später werden sich daher viele Firmen mit der Frage beschäftigen müssen, wie sie KI-Infrastruktur sinnvoll integrieren. Das betrifft besonders Provider aller Größenordnungen, die ihren Kunden entsprechende Hardware oder Algorithmen zur Miete anbieten möchten.
Die GPU als Stromfresser
KI-Hardware zwingt die heute meist luftgekühlten Systeme zur Anpassung. Vor allem GPUs treiben die Leistungsaufnahme in ungeahnte Höhen. Dabei ist zwischen dem Thermal Design Point (TDP) und der Spitzenleistung zu unterscheiden. Der TDP beschreibt jene Dauerlast, bei der das System zuverlässig unterhalb der maximal zulässigen Temperatur bleibt. In der Praxis treten jedoch regelmäßig Leistungsspitzen auf, die die Maximaltemperatur über längere Zeiträume überschreiten.
Die TDP-Werte aktueller GPU-Modelle liegen inzwischen im hohen drei- und sogar vierstelligen Wattbereich. Werden – technisch problemlos – 168 GPUs in einem Rack verbaut, entstehen Leistungsaufnahmen im Bereich mehrerer hundert Kilowatt. Ein Beispiel: NVIDIAs Blackwell Ultra liegt bei 1400 W, sein Vorgänger bei 1200 W. Der H100 kam noch mit 700 W aus. Auch AMD bildet keine Ausnahme; der MI355X liegt bei 1100 W.
In einem üblichen 42-Zoll-Rack mit 21 Servern und jeweils acht GPUs ergibt das die genannten 168 GPUs. Allein diese kommen bei H100-Bestückung auf rund 117 kW Leistungsaufnahme. Mit Blackwell Ultra sind es bereits mehr als 235 kW – und das nur für die Server, ohne Zusatzverbraucher. Real dürfte der Wert also noch höher liegen.
Luftgekühlten Systemen geht die Puste aus
Unter solchen Bedingungen geraten luftgekühlte Systeme unweigerlich an ihre Grenzen. Ab etwa 40 kW pro Rack reicht die Luftkühlung nicht mehr aus. Laut Anbietern wie Schneider Electric ließe sich der Leistungsrahmen zwar erhöhen, allerdings nur um den Preis deutlich größerer Racks. Um die steigende Wärmelast zu bewältigen, bräuchte es voluminösere Kühlkörper. Damit würden auch die Servergehäuse höher ausfallen, sodass weniger Einheiten in ein Rack passen, was wiederum den Platzbedarf weiter erhöht.
Das widerspricht dem gängigen Ziel, möglichst viele GPUs in einem Standardrack zu platzieren, um eine kompakte, leistungsfähige KI-Insel innerhalb eines bestehenden Rechenzentrums aufzubauen. Gleichzeitig soll aus Platz- und Kostengründen möglichst wenig Fläche verbraucht werden.
Hinzu kommt, dass konventionelle Prozessorkerne in klassischen Servern im Subsekundenbereich stark schwanken: Sie überschreiten ihren TDP kurzzeitig, fallen aber in ebenso schnellen Idle-Phasen wieder unter ihn zurück. Da die Kerne asynchron arbeiten, gleichen sich Spitzen und Täler über die Zeit hinweg aus. Auf Systemebene führt das in der Regel dazu, dass Temperatur- und Leistungsrahmen eingehalten werden.
Bei GPUs sieht die Situation jedoch grundlegend anders aus: Eintreffende Aufgaben werden massiv parallelisiert und weitgehend synchron abgearbeitet. So entstehen extreme Leistungsspitzen und -täler, die sich gegenseitig verstärken, statt sich auszugleichen. Die summierten Kernleistungen erzeugen regelrechte Mikro-Hitzewellen an den Peaks der synchronen Lastkurve. Die Kühltechnik muss dafür ausgelegt sein.
Flüssigkühlung wird unvermeidlich
Unter diesen Voraussetzungen stößt konventionelle Luftkühltechnik an klare physikalische Grenzen. Das Problem liegt insbesondere im sekundären oder tertiären Kühlkreis, der die Wärme möglichst unmittelbar von der Hardware abführen muss. Kühlkreise werden in der Kälte- und Klimatechnik von außen nach innen gezählt: Der Primärkreis transportiert die Wärme zur endgültigen Wärmedeponie, während die inneren Kreise direkt an der Hitzequelle sitzen. In äußeren Kühlkreisen kommt heute oft Wasser zum Einsatz, teils auch Luft.
Bei mehr als 40 kW pro Rack ist der zumindest teilweise Einstieg in die Flüssigkühlung unausweichlich, schon weil die Leistungsaufnahmen künftig eher steigen als sinken. Konventionelle CRACs (Computer Room Air Conditioner), die erhitzte Luft abkühlen und wieder in den Serverraum leiten, reichen nicht mehr aus. Auch CRAH-Systeme (Computer Room Air Handler), die die Abwärme an einen wasserbasierten Primärkreis übergeben, geraten schnell an ihre Grenzen. Der Primärkreis wird üblicherweise über Kühltürme auf dem Dach oder neben dem Rechenzentrum gekühlt, teils unterstützt durch Adiabatik, also eine Verdunstungstechnik, die die Kühlleistung erhöht. Doch für dichte KI-Lasten genügt dies meist nicht mehr.
Bild 1: Schematischer Aufbau eines Flüssigkühlsystems im Rechenzentrum mit Kondensator-, Gebäude- und Technik-Kühlkreis. (Quelle: Schneider Electric)
Einstieg per Kühltür
Der kleinstmögliche Schritt in Richtung Flüssigkühlung ist die Nachrüstung eines Racks mit einer Kühltür auf der Rückseite. Dabei wird die von den Servern nach hinten ausgeblasene Wärme unmittelbar an eine in der Tür zirkulierende Kühlflüssigkeit abgegeben. Diese Flüssigkeit gilt es anschließend an den nächsten Kühlkreis zu übertragen. Die dazu erforderliche Übergabeeinheit sitzt entweder unten im Rack oder steht neben ihm. In der zweiten Variante kann eine solche Einheit auch mehrere Kühltüren mit dem primären Kühlkreis verbinden.
Die Flüssigkeit selbst zirkuliert in der Tür in einem geschlossenen Kreislauf. An einem Wärmetauscher wird sie abgeführt und an den primären Kühlkreis übergeben. Flüssigkeit befindet sich damit zwar am Rack, aber nicht im Inneren – ein Punkt, der vielen Anwendern heute noch wichtig ist, weil Flüssigkeitsinstallationen im Rack nach wie vor als potenziell risikobehaftet gelten.
Ein Vorteil dieses Ansatzes liegt darin, dass die Architektur des Serverraums kaum angepasst werden muss. Kühltüren erlauben es, innerhalb eines bestehenden Rechenzentrums moderat leistungsfähigere Rackinseln zu schaffen, ohne die gesamte Umgebung umzubauen. Allerdings erfordert das Rack selbst einen Umbau, was zusätzlichen Aufwand bedeutet.
Die Leistungsfähigkeit dieser Variante ist außerdem begrenzt. Die Luft transportiert trotz Kühltür nur eine bestimmte Wärmemenge ab. Die Kühlleistung steigt also gegenüber klassischer Luftkühlung, bleibt aber im Rahmen dessen, was über Luft überhaupt möglich ist. Wer in Richtung hochdichter KI-Systeme gehen möchte, benötigt daher eine leistungsstärkere Technik.
Direkte Chipkühlung
Die direkte Chipkühlung gilt heute als verbreitetste Technik für höhere Kühlleistungen. Sie setzt voraus, dass Racks entweder bereits für Flüssigkühlung vorbereitet sind oder entsprechend ausgerüstet werden. Dafür benötigen sie Flüssigkeitsverteiler (Manifolds), eine Coolant Distribution Unit (CDU) mit Steuerungs- und Überwachungstechnik sowie Cold Plates, die direkt auf den hitzeerzeugenden Prozessoren oder Beschleunigerkarten sitzen.
Viele Hersteller integrieren Cold Plates inzwischen direkt in ihre Systeme. Fehlt diese Integration, lassen sich passende Modelle nachrüsten, idealerweise abgestimmt auf die jeweilige Prozessorgeneration. Die Verteiltechnik ist jedoch noch unzureichend standardisiert. Zwar arbeitet etwa das Open Compute Project (OCP) an Normen, doch aktuell liegt die Verantwortung bei den Betreibern, Schläuche, Ventile, Pumpen, Kühlflüssigkeiten und Elektronik sauber aufeinander abzustimmen.
Nachrüstungen können besonders sinnvoll sein, wenn nur ein Teil der Höheneinheiten eines Racks KI-Systeme aufnehmen soll. In solchen Fällen benötigen lediglich diese Bereiche Flüssigkühlung, während die übrigen Komponenten weiterhin luftgekühlt bleiben. Dadurch entsteht im selben Rack ein Parallelbetrieb zweier Kühlkonzepte, was die Planung komplexer macht.
Kühltechnik und Leistungsbereiche
Die Rack-CDU mit Wärmetauscher befindet sich in der Regel im unteren Bereich des Racks. Tritt dort Flüssigkeit aus, bleiben die verbauten Systeme trotzdem geschützt. Größere CDUs stehen neben den versorgten Racks. Solche Bodengeräte lassen sich auch in den Doppelboden integrieren, sofern sie den Luftstrom nicht behindern. Sie können mehrere Racks gleichzeitig versorgen und eignen sich vor allem in Installationen mit hoher Dichte. Ab etwa zehn zu kühlenden Racks empfehlen Anbieter den Einsatz dieser bodenmontierten Einheiten.
Die Kapazitäten variieren stark: Rackmount-CDUs schaffen typischerweise etwa bis zu 80 kW. Boden- oder Standgeräte erreichen mehrere Hundert Kilowatt, teils sogar einige Megawatt. Manche Systeme lassen sich zudem modular erweitern, sodass ihre Leistungsfähigkeit nahezu beliebig nach oben skaliert.
Ein oft übersehener Aspekt betrifft das zusätzliche Gewicht. Flüssige Kühltechnik, Leitungen und Verteilkomponenten erhöhen die Last auf Böden und Zwischendecken. Besonders ältere Rechenzentren verfügen nicht immer über die erforderlichen Tragreserven. Betreiber sollten deshalb prüfen, ob die baulichen Gegebenheiten ausreichen oder ob Verstärkungen nötig sind.
Nach Einschätzung des Beratungsunternehmens Tate Europe können Modernisierungen bestehender Rechenzentren dennoch deutlich kostengünstiger ausfallen als komplette Neubauten. Das Unternehmen spricht von 20 bis 40 Prozent geringeren Kosten und einer Einsparung von rund 50 Prozent beim sogenannten „Embedded Carbon“, also dem in Gebäuden und Anlagen gebundenen Kohlendioxid. Bei Abriss und Neubau gelangt ein Großteil dieses CO2 in die Atmosphäre – in Zukunft möglicherweise sogar kostenpflichtig.
Immersion – Kühlung im Vollbad
Die Immersionskühlung gilt derzeit als leistungsstärkste, aber zugleich am wenigsten verbreitete Variante der Flüssigkühlung. Hier kommen die rechnenden Komponenten vollständig ohne ihre gewohnten Gehäuse aus und arbeiten in einem Tank, der mit einer nicht leitenden, sehr gut wärmeleitfähigen Flüssigkeit gefüllt ist. Anstelle klassischer Racks hängen die Systeme an speziellen Halterungen im Inneren des Tanks.
Grundsätzlich existieren zwei Ansätze: einphasige und zweiphasige Immersionskühlung. Bei der einphasigen Variante bleibt das Kühlmedium kontinuierlich flüssig. Pumpen wälzen es um, leiten es an Wärmetauschern vorbei und führen die Wärme auf diesem Weg ab. Der technische Aufwand ist höher, ebenso der Energieverbrauch der Pumpen.
Die zweiphasige Immersionskühlung arbeitet ohne Pumpen. Das Kühlmittel verdampft direkt an den heißen Komponenten. Der entstehende Dampf steigt nach oben, trifft auf Wärmetauscher, gibt dort die Wärme ab und kondensiert wieder. Anschließend fließt das Kühlmedium zurück in den unteren Bereich des Tanks. Dieser Kreislauf nutzt ausschließlich die natürliche Konvektion. Das Verfahren erzeugt eine sehr gleichmäßige Temperaturverteilung und ermöglicht hohe Kühlleistungen.
Immersionssysteme nehmen die Wärme besonders effizient und großflächig auf. Die abgeführte Wärme erreicht Temperaturen, die sich gut zur Weitergabe an Heizkreisläufe eignen. Kritisch bleibt jedoch der radikale Systemwechsel: Racks weichen Tanks, die gesamte Infrastruktur muss dafür ausgelegt sein. Zudem fehlen in vielen Bereichen noch Standards. Auch Berichte über Materialinkompatibilitäten – etwa bei bestimmten Kabelummantelungen – verunsichern potenzielle Anwender.
Aktuell findet Immersionskühlung vor allem in großen Forschungseinrichtungen Einsatz, die sehr leistungsdichte Serverfarmen betreiben. Mit zunehmender Standardisierung und weiter steigenden Anforderungen an die Performance könnte diese Technik jedoch langfristig eine relevante Alternative zur direkten Chipkühlung werden.
Die wachsende Bedeutung leistungsstarker Kühltechniken hat inzwischen dazu geführt, dass einige Infrastrukturhersteller komplette Systeme für den Aufbau von KI-Rechenzentren anbieten. Ein Beispiel ist VertivOneCore, das im August dieses Jahres vorgestellt wurde. Das System umfasst unter anderem Vertivs Kühlmittelverteilung CoolLoop für die Flüssigkühlung und adressiert damit Betreiber, die eine integrierte Umgebung für hochdichte KI-Lasten benötigen.
Immersion für Kryptominer
Auch im Bereich der Immersionskühlung entstehen spezialisierte Produkte für bestimmte Zielgruppen. Ein Beispiel dafür liefert der texanische Anbieter Midas, gegründet 2010. Das Unternehmen entwickelte einen zwölf Höheneinheiten großen Immersionstank speziell für den Einsatz im Kryptomining. Die kompakte Einheit soll bis zu 150 W je Miner abführen und richtet sich an Betreiber, die hohe Gerätezahlen möglichst energieeffizient und platzsparend betreiben möchten.Midas setzt dabei auf ein besonders leistungsfähiges und umweltfreundliches Kühlmedium. Es trägt die Bezeichnung Qloe und stammt vom französischen Unternehmen Oleon. Die Flüssigkeit wurde speziell für Immersionsanwendungen mit hohen thermischen Anforderungen entwickelt und bietet laut Hersteller gute Materialverträglichkeit und hohe Wärmeleitfähigkeit.
Ein Blick ins Technologielabor
Nach einigen Jahrzehnten vergleichsweise geringer Bewegung entwickelt sich die Kühltechnik momentan rasant weiter. Start-ups bringen neue Ansätze ins Spiel, große Anbieter investieren, um den Anschluss nicht zu verlieren. Ein Beispiel dafür ist das Schweizer Unternehmen Corintis, das seit 2022 an einer neuartigen Form der Kühlung arbeitet.
Corintis verfolgt die Idee, die Wärme direkt dort abzuführen, wo sie entsteht: im Chip selbst. Dafür setzt das Unternehmen auf Mikrofluidik, also winzige Kühlkanäle, die direkt in das Silizium integriert werden. Dieses Verfahren soll die Kühlleistung im Vergleich zu Cold Plates verdreifachen und die Temperatur von GPUs um bis zu 65 Prozent senken. Durch die zusätzliche thermische Reserve lassen sich die Chips phasenweise sogar übertakten, ohne sie zu gefährden – ein Aspekt, der im KI-Umfeld auf großes Interesse stößt.
Mikrofluidik erleichtert außerdem das Design von 3D-Chips, da sich einzelne Ebenen gezielt kühlen lassen. Die Abwärme dieser Systeme erreicht Temperaturen von rund 70 Grad Celsius und eignet sich gut für Fernwärmekreisläufe. Die Kühlstrukturen orientieren sich an biologischen Vorbildern wie den Mustern von Schmetterlingsflügeln und werden mithilfe von Optimierungsalgorithmen für jeden Chip neu berechnet. Laut Corintis lässt sich die Technik nachträglich integrieren; künftig soll sie auch direkt chipseitig verfügbar sein.
Neue Komponenten für hohe Leistungsdichten
Das verstärkte Interesse an leistungsstarken Kühlsystemen sorgt dafür, dass etablierte Anbieter ihr Portfolio erweitern. Schneider Electric investierte zuletzt in den Flüssigkühlungsspezialisten Motivair. Dessen CDUs decken einen Leistungsbereich von 105 kW bis 2,5 MW ab. Eine speziell für den KI-Bereich entwickelte Einheit – die sogenannte „Heat Dissipation Unit“ – erreicht 100 kW und ist in einem 600 mm breiten Gehäuse untergebracht. Ihr Liquid-to-Air-Kühlkreislauf schafft bis zu 135 kW. Motivair bietet zudem eine Kühltür an, die 75 kW abführt. Dieses Portfolio ist bereits in ein gemeinsam mit Nvidia entwickeltes Referenzkonzept für KI-Rechenzentren eingeflossen.
Bild 2: Rittals neues, Rack-reihentaugliches Kühlaggregat führt laut Hersteller bis zu 1 MW Abwärme ab – genug für hochverdichtete KI-Installationen.
Der Anbieter Accelsius verfolgt einen anderen Ansatz und zielt auf Umgebungen mit extrem leistungsstarken GPUs von bis zu 4500 W ab. Die zweiphasige In-Row-CDU des Unternehmens liefert 250 kW und erreicht eine Durchflussrate von 375 Litern pro Minute. Sie richtet sich an Betreiber, die sehr hohe Energiedichten auf engem Raum bewältigen müssen.
Auch bei den Kühlmedien selbst gibt es Fortschritte. Das Start-up HT Material Science (HTMS) erhöht die Kühlkapazität herkömmlicher Wasser-Glykol-Gemische, indem es Nanopartikel aus Aluminiumoxid unter 100 nm einsetzt. Laut Hersteller steigert dies die Kühlleistung um 26 Prozent. Die Partikel gelangen über einen Tank mit Dosieranlage in den Kreislauf und bleiben aufgrund der geschlossenen Führung im System. Soll das Kühlmedium gereinigt werden, lassen sich die Nanopartikel durch eine chemische Reaktion schnell entfernen.
Kühlender Windstrom durch Ionen
Ein weiteres Innovationsfeld bildet die Kühlung durch Ionisierung. Daran arbeitet der Madrider Start-up YPlasma, eine Ausgründung des spanischen Forschungsinstituts INTA (Instituto Nacional de Técnica Aeroespacial). Die grundlegende Idee: Ein elektrostatisches Feld ersetzt die klassischen Ventilatoren und erzeugt einen direkten Luftstrom.
Die Technik nutzt sogenannte „Plasma-Aktuatoren“. Sie sitzen auf der Oberfläche des zu kühlenden Bauteils und erzeugen ein starkes elektrisches Feld. Dadurch beschleunigt sich die umgebende Luft und strömt entlang der Oberfläche. Je höher die Spannung ausfällt, desto intensiver der erzeugte Luftstrom. Eine Grenzschicht – wie bei herkömmlichen Lüftern – bildet sich dabei nicht. Die Aktuatorschicht schützt das Bauteil zusätzlich vor äußeren Einflüssen.
Im Experiment gelang es mit diesem Verfahren, einen 80-mm-Lüfter bei einer Last von 10 W vollständig zu ersetzen. YPlasma sieht potenzielle Einsatzgebiete sowohl in Servern als auch in Wärmetauschern, also überall dort, wo platzsparende oder vibrationsfreie Luftführung gefragt ist. Auch andere Unternehmen arbeiten an ähnlichen Ansätzen. Apple sicherte sich bereits 2012 ein Patent für eine vergleichbare Technologie, hat sie bislang aber nicht in Produkte überführt.
Fazit
KI und maschinelles Lernen erhöhen die Leistungsdichten im Rechenzentrum deutlich und damit auch die Anforderungen an die Kühlung. Luftkühlung reicht bei modernen GPU-Architekturen nur noch in Ausnahmefällen aus. Flüssigkühlung – ob per Kühltür, direkt am Chip oder als Immersion – wird damit zur Schlüsseltechnik für den Betrieb hochdichter Systeme. Parallel treiben neue Ansätze wie Mikrofluidik, verbesserte Kühlmedien oder ionenbasierte Luftströme die Entwicklung weiter voran. Betreiber sollten deshalb früh prüfen, welche Kühlverfahren zur geplanten Rechenlast passen und wo sich zukünftige Erweiterungen sinnvoll integrieren lassen.
(ln)