Die wahren Gewinner des KI-Booms sind nicht die KI-Unternehmen – sondern die Infrastruktur-Ebene

Jeder Goldrausch macht Schaufelverkäufer zu Millionären. Der KI-Superzyklus 2024–2026 folgt dem gleichen Muster – während OpenAI, Anthropic und Google darüber streiten, welches Modell das klügste ist, verzeichnen die Unternehmen, die GPUs, Netzwerke, Strom, Kühlung und Cloud-Infrastruktur verkaufen, Rekordumsätze mit dicken Margen. Hier ist die Infrastruktur-Ebene, die tatsächlich Geld druckt.
Nvidias anhaltende Dominanz
Nvidias Data-Center-Umsatz erreichte 35,6 Milliarden Dollar in einem einzigen Quartal (Q1 des Geschäftsjahres 2026) – eine Zahl, die vor fünf Jahren fiktiv gewirkt hätte. Der Übergang von H100/H200 zur Blackwell-Architektur ist in vollem Gange, wobei GB200-NVL72-Rack-Systeme über 3 Millionen Dollar pro Rack kosten und immer noch monatelang nachbestellt werden.
Der entscheidende technische Sprung bei Blackwell ist NVLink 5, das eine GPU-zu-GPU-Bandbreite von 1,8 TB/s liefert. Dadurch kann ein 72-GPU-Inferenz-Cluster wie ein einziger massiver Beschleuniger agieren – entscheidend für das Serving großer Modelle, bei dem die Latenz zwischen GPUs zuvor eine harte Grenze darstellte. Die Nachfrage übersteigt das Angebot weiterhin deutlich, was Nvidia eine außergewöhnliche Preissetzungsmacht verleiht.
AMDs MI300X ist ein ernstzunehmender Konkurrent – er hat eine jährliche Umsatzrate von über 5 Milliarden Dollar erreicht und gewinnt bei Hyperscalern und Cloud-Anbietern bedeutende Einsätze. Aber Nvidias CUDA-Ökosystem, das über 15 Jahre Entwickler-Tooling, Framework-Integration und Softwarebibliotheken aufgebaut wurde, bleibt der primäre Burggraben. Der Wechsel von CUDA zu ROCm erfordert echte Engineering-Investitionen, und die meisten KI-Teams gehen diesen Schritt nur, wenn die Kosteneinsparungen signifikant sind.
Das Netzwerk-Spiel – Ethernet vs. InfiniBand
Netzwerke sind der unsichtbare Flaschenhals in KI-Cluster-Aufbauten. InfiniBand, ursprünglich für HPC entwickelt und jetzt von Nvidia (durch die Mellanox-Übernahme 2020) kontrolliert, dominiert leistungsstarke KI-Trainingscluster. Sein latenzarmes, durchsatzstarkes Fabric ist genau für die All-Reduce-Operationen konzipiert, auf denen verteiltes Training basiert.
Aber die Hyperscaler wehren sich. Google, Microsoft und Meta bauen Ethernet-basierte KI-Netzwerke nach der Ultra-Ethernet-Consortium (UEC)-Spezifikation auf – eine gemeinsame Anstrengung, InfiniBand-Level-Leistung zu niedrigeren Kosten und ohne Vendor Lock-in auf Standard-Ethernet zu bringen. Dies schafft eine große Chance für Arista Networks (High-Radix-Switches), Broadcom (Tomahawk 5 ASIC, der 51,2 Tbps pro Chip liefert) und Cisco.
Broadcom hat bis 2027 einen kumulierten KI-Netzwerk-ASIC-Umsatz von über 60 Milliarden Dollar prognostiziert – eine Zahl, die sowohl organisches Wachstum als auch den Ethernet-Übergang der Hyperscaler widerspiegelt. Maßgeschneiderte Siliziumlösungen beschleunigen denselben Trend: Googles TPUs, AWS Trainium 2 und Microsofts Maia 100 reduzieren alle die Abhängigkeit von Nvidia für Trainings-Workloads, während die Ausgaben auf eigene Siliziumlösungen und die Netzwerk-Anbieter, die diese verbinden, gelenkt werden.
Strom und Kühlung – der übersehene Flaschenhals
Ein einziges GB200-NVL72-Rack zieht 120 kW Leistung. Ein 1.000-GPU-Cluster verbraucht kontinuierlich 1,67 MW – etwa so viel wie 1.400 durchschnittliche US-Haushalte, 24/7 in Betrieb. Bei dieser Dichte sind nicht mehr die GPUs der Engpass, sondern die Stromversorgung und das Wärmemanagement.
Traditionelle luftgekühlte Rechenzentren erreichen maximal etwa 20–30 kW pro Rack. KI-optimierte Einrichtungen benötigen direkte Flüssigkeitskühlung (DLC) – Kühlmittelrohre, die direkt zum Server-Chassis führen und die Wärme an der Quelle abführen. Vertiv ist einer der Hauptprofiteure und liefert Flüssigkeitskühlsysteme und Präzisionskühlungsinfrastruktur weltweit. Eaton liefert unterbrechungsfreie Stromversorgungen (USV) und Stromverteilungseinheiten (PDU) auf Rack- und Reihenebene. Bloom Energies On-Site-Brennstoffzellen werden zunehmend eingesetzt, um die Netzstromversorgung in KI-Anlagen im großen Maßstab zu ergänzen.
Data-Center-REITs profitieren von der strukturellen Angebotsknappheit. Equinix und Digital Realty bauen von Grund auf KI-optimierte Campus-Anlagen – ausgelegt auf 50–100 kW pro Rack mit von Anfang an integrierter DLC. Die entscheidende Dynamik: Ein neues, KI-fähiges Rechenzentrum mit 100 MW benötigt 18–24 Monate für Genehmigung, Planung und Bau. Dieser Rückstand schafft eine erhebliche Preissetzungsmacht für bestehende Betreiber mit aktuell verfügbarer Kapazität.
Der Capex-Boom der Cloud-Hyperscaler
Das Ausmaß der Hyperscaler-Ausgaben ist kaum zu übertreiben. Microsoft hat für 2026 Investitionsausgaben von 80 Milliarden Dollar zugesagt, hauptsächlich für KI-Infrastruktur. Google hat 75 Milliarden Dollar angekündigt. Amazons Wert ist mit 105 Milliarden Dollar der höchste. Dies sind keine Marketing-Versprechen – sie zeigen sich in den Quartalsergebnissen als konkrete Bau- und Ausrüstungsausgaben.
Das Geld fließt downstream zu einer konzentrierten Gruppe von Lieferanten. TSMC fertigt die H20- und B200-Chips und übernimmt das fortschrittliche CoWoS-Packaging (Chip-on-Wafer-on-Substrate), das HBM-Speicher direkt auf den GPU-Die stapelt. CoWoS-Kapazität war ein berichteter Engpass bei der GB200-Produktion – TSMC arbeitet bereits bei voller Auslastung und erweitert die Kapazität mit einem Tempo, das immer noch hinter der Nachfrage zurückbleibt.
SK hynix und Samsung liefern HBM3 und HBM3E, den Hochbandbreitenspeicher, der moderne KI-Beschleuniger ermöglicht. ASML liefert die EUV-Lithografiemaschinen, ohne die hochmoderne Chips nicht hergestellt werden können. Die gesamte Lieferkette läuft heiß – und da jeder Ausbau Jahre dauert, wird die Preissetzungsmacht der eingeschränkten Lieferanten bis weit ins Jahr 2027 anhalten.
Die Startup-Ebene – Schaufeln und Werkzeuge der Infrastruktur
Unterhalb der Hyperscaler-Ebene fängt eine Welle von Infrastruktur-Startups die Nachfrage ein, die Amazon, Microsoft und Google nicht oder nicht bedienen können:
- CoreWeave: Das am meisten beachtete GPU-Cloud-Startup. Sammelte 2025 11,9 Milliarden Dollar bei einer Bewertung von 23 Milliarden Dollar ein, basierend auf einer Flotte von Nvidia H100s, die zu Premium-Preisen an KI-Unternehmen vermietet werden. Profitabel auf Pro-GPU-Basis und expandiert aggressiv in Blackwell-Hardware.
- Lambda Labs: KI-fokussierte GPU-Cloud mit 320 Millionen Dollar Finanzierung. Zielgruppe sind Forscher und mittelständische KI-Teams, die keine Hyperscaler-Kontingente bekommen – ein echtes Problem angesichts der Wartelisten von AWS und Azure.
- Together AI: Inference-API-Startup, spezialisiert auf optimiertes Multi-Modell-Serving. Bietet Zugang zu Open-Weight-Modellen (Llama, Mistral usw.) zu wettbewerbsfähigen Preisen pro Token, mit Fokus auf Durchsatz.
- Modal: Serverless-GPU-Compute für Entwickler. Abstrahiert das Cluster-Management – man schreibt Python, Modal kümmert sich um Provisionierung, Skalierung und Abrechnung pro Sekunde tatsächlicher GPU-Nutzung.
- Groq: Hat die LPU (Language Processing Unit) entwickelt, einen zweckbestimmten Chip für Inferenz. Behauptet über 500 Tokens pro Sekunde bei Llama-Klasse-Modellen – deutlich schneller als GPU-basierte Inferenz bei vergleichbaren Kosten für bestimmte Workloads.
- Cerebras: Wafer-Scale-Chip-Architektur, die einen ganzen Silizium-Wafer in einen einzigen Prozessor packt. Kürzlich IPO-Antrag eingereicht. Starke Positionierung für Trainings-Workloads, bei denen die Modellgröße die Speichergrenzen einer einzelnen GPU überschreitet.
Die Bewertungsmathematik
Infrastrukturunternehmen im KI-Zyklus werden mit Umsatzmultiplikatoren gehandelt, die 2–3x über den historischen Software-Benchmarks liegen – und das aus nachvollziehbaren Gründen. KI-Infrastruktur ist knapp (angebotsseitig begrenzt), kapitalintensiv (hohe Eintrittsbarrieren) und klebrig (Wechselkosten sind real). Diese Bedingungen rechtfertigen Premium-Multiplikatoren.
CoreWeaves Bewertung von 23 Milliarden Dollar bei einem ARR von etwa 4 Milliarden Dollar impliziert einen Umsatzmultiplikator von 5–6x. Das klingt hoch, bis man es mit AWS vergleicht, das bei etwa 7x gehandelt wird – bei einem diversifizierteren, reiferen Geschäft. Die Infrastruktur-Ebene könnte auf 3–5 Jahre Sicht sogar besser positioniert sein als die Modellebene: Modelle werden zur Ware, da Open-Weight-Alternativen die Lücke schließen, aber Compute wird nicht zur Ware. Die Kosten einer GPU-Stunde fallen nicht, nur weil ein neues LLM erscheint.
Fazit
Der KI-Boom ist real, und die Capex-Welle hat gerade erst begonnen – die Ausgaben der Hyperscaler beschleunigen sich, nicht abflachend. Aber die sichersten Wetten in diesem Zyklus sind nicht darauf, welches LLM den nächsten Benchmark gewinnt. Sie sind auf die Unternehmen, die unabhängig vom Gewinner bezahlt werden.
Strominfrastruktur, KI-Netzwerk-ASICs, kundenspezifische Siliziumlösungen, HBM-Speicher, EUV-Lithografie und spezialisierte GPU-Clouds profitieren alle von der Capex-Welle, egal ob GPT-5, Claude 4 oder Gemini Ultra im Jahr 2027 dominiert. Die Modellunternehmen verbrennen Kapital, um sich zu differenzieren. Die Infrastruktur-Ebene kassiert die Miete.