Les vrais gagnants du boom de l'IA ne sont pas les entreprises d'IA — ce sont les infrastructures | IRCNF - Intelligent Reliable Custom Next-gen Frameworks

Chaque ruée vers l'or enrichit les vendeurs de pelles. Le supercycle IA 2024-2026 suit le même schéma : pendant qu'OpenAI, Anthropic et Google se disputent pour savoir quel modèle est le plus intelligent, les entreprises qui vendent GPU, réseau, électricité, refroidissement et cloud engrangent des revenus records avec des marges confortables. Voici la couche infrastructure qui imprime vraiment de l'argent.

La domination persistante de Nvidia

Le chiffre d'affaires data center de Nvidia a atteint 35,6 milliards de dollars en un seul trimestre (Q1 FY2026) — un chiffre qui aurait semblé irréel il y a cinq ans. La transition du H100/H200 vers l'architecture Blackwell est bien engagée, avec les racks GB200 NVL72 facturés plus de 3 millions de dollars pièce et toujours en rupture de stock pour plusieurs trimestres.

L'innovation clé de Blackwell est le NVLink 5, qui offre une bande passante GPU-à-GPU de 1,8 To/s. Cela permet à un cluster d'inférence de 72 GPU de se comporter comme un seul accélérateur massif — essentiel pour servir des modèles de grande taille où la latence inter-GPU était auparavant un mur infranchissable. La demande continue de dépasser largement l'offre, donnant à Nvidia un pouvoir de fixation des prix extraordinaire.

Le MI300X d'AMD est un concurrent sérieux — il a dépassé un rythme annuel de 5 milliards de dollars de revenus et gagne des déploiements significatifs chez les hyperscalers et les fournisseurs cloud. Mais l'écosystème CUDA de Nvidia, construit sur 15 ans d'outils développeurs, d'intégration de Framework et de bibliothèques logicielles, reste le principal fossé défensif. Passer de CUDA à ROCm nécessite un réel investissement en ingénierie, et la plupart des équipes IA ne font ce compromis que si les économies sont massives.

Le réseau — Ethernet contre InfiniBand

Le réseau est le goulot d'étranglement invisible des clusters IA. InfiniBand, développé à l'origine pour le HPC et désormais contrôlé par Nvidia (via l'acquisition de Mellanox en 2020), domine les clusters d'entraînement haute performance. Son fabric à faible latence et haut débit est conçu pour les opérations all-reduce dont dépend l'entraînement distribué.

Mais les hyperscalers résistent. Google, Microsoft et Meta construisent des réseaux IA basés sur Ethernet via la spécification Ultra Ethernet Consortium (UEC) — un effort collaboratif pour apporter les performances d'InfiniBand à l'Ethernet standard à moindre coût et sans dépendance propriétaire. Cela crée une opportunité majeure pour Arista Networks (commutateurs haute densité), Broadcom (ASIC Tomahawk 5, qui pousse 51,2 Tbps par puce) et Cisco.

Broadcom prévoit plus de 60 milliards de dollars de revenus cumulés d'ASIC pour le réseau IA d'ici 2027 — un chiffre qui reflète à la fois la croissance organique et la transition vers Ethernet chez les hyperscalers. Le silicium personnalisé accélère cette tendance : les TPU de Google, AWS Trainium 2 et Microsoft Maia 100 réduisent tous la dépendance à Nvidia pour les charges d'entraînement, tout en orientant les dépenses vers leur propre silicium et les fournisseurs de réseau qui le connectent.

Électricité et refroidissement — le goulot d'étranglement oublié

Un seul rack GB200 NVL72 consomme 120 kW. Un cluster de 1 000 GPU maintient une consommation continue de 1,67 MW — soit l'équivalent d'environ 1 400 foyers américains moyens, 24h/24 et 7j/7. À cette densité, la contrainte n'est plus les GPU. C'est la distribution électrique et la gestion thermique.

Les data centers refroidis par air plafonnent à environ 20-30 kW par rack. Les installations optimisées pour l'IA nécessitent un refroidissement liquide direct (DLC) — des tuyaux de liquide de refroidissement qui vont directement au châssis du serveur, évacuant la chaleur à la source. Vertiv est l'un des principaux bénéficiaires, fournissant des systèmes de refroidissement liquide et des infrastructures de régulation thermique dans le monde entier. Eaton fournit des onduleurs (UPS) et des unités de distribution d'énergie (PDU) au niveau du rack et du rang. Les piles à combustible sur site de Bloom Energy sont de plus en plus déployées pour compléter le réseau électrique dans les installations IA à grande échelle.

Les REIT de data centers bénéficient de la pénurie structurelle d'offre. Equinix et Digital Realty construisent des campus optimisés pour l'IA de toutes pièces — conçus pour des densités de 50 à 100 kW par rack avec DLC intégré dès la fondation. Le facteur clé : un nouveau data center IA-ready de 100 MW nécessite 18 à 24 mois pour les permis, la conception et la construction. Ce retard crée un pouvoir de fixation des prix significatif pour les opérateurs existants disposant de capacité disponible aujourd'hui.

La vague de Capex des hyperscalers du cloud

L'ampleur des dépenses des hyperscalers est difficile à surestimer. Microsoft s'est engagé à 80 milliards de dollars de dépenses d'investissement en 2026, principalement pour les infrastructures IA. Google a annoncé 75 milliards. Le chiffre d'Amazon est le plus élevé, à 105 milliards. Il ne s'agit pas d'engagements marketing — ils apparaissent dans les résultats trimestriels sous forme de dépenses concrètes en construction et en équipement.

L'argent coule en aval vers un ensemble concentré de fournisseurs. TSMC fabrique les puces H20 et B200 et assure le packaging avancé CoWoS (Chip-on-Wafer-on-Substrate) qui empile la mémoire HBM directement sur le die du GPU. La capacité CoWoS a été signalée comme un goulot d'étranglement pour la production de GB200 — TSMC fonctionne à pleine capacité et étend sa production à un rythme qui reste inférieur à la demande.

SK hynix et Samsung fournissent la HBM3 et HBM3E, la mémoire à large bande passante qui rend possibles les accélérateurs IA modernes. ASML fournit les machines de lithographie EUV sans lesquelles les puces de pointe ne peuvent être fabriquées. Toute la chaîne d'approvisionnement tourne à plein régime — et comme chaque maillon prend des années à se développer, le pouvoir de fixation des prix des fournisseurs contraints persistera bien au-delà de 2027.

La couche startup — pioches et pelles pour l'infrastructure

Sous le niveau des hyperscalers, une vague de startups d'infrastructure capte la demande qu'Amazon, Microsoft et Google ne peuvent ou ne veulent pas servir :

CoreWeave : La startup de cloud GPU la plus surveillée. A levé 11,9 milliards de dollars pour une valorisation de 23 milliards en 2025, construite sur une flotte de H100 Nvidia loués à des entreprises d'IA à des tarifs premium. Rentable par GPU et en pleine expansion vers le matériel Blackwell.
Lambda Labs : Cloud GPU spécialisé dans l'IA, avec 320 millions levés. Vise les chercheurs et les équipes IA de taille moyenne qui n'obtiennent pas de quotas chez les hyperscalers — un vrai problème vu les listes d'attente chez AWS et Azure.
Together AI : Startup d'API d'inférence spécialisée dans le service multi-modèle optimisé. Propose l'accès à des modèles open-weight (Llama, Mistral, etc.) à des prix compétitifs par Token, avec un accent sur le débit.
Modal : Calcul GPU serverless pour développeurs. Abstrait la gestion du cluster — vous écrivez du Python, Modal s'occupe du provisionnement, du scaling et de la facturation à la seconde d'utilisation GPU réelle.
Groq : A construit le LPU (Language Processing Unit), une puce dédiée à l'inférence. Revendique plus de 500 tokens/seconde sur des modèles de la classe Llama — nettement plus rapide que l'inférence GPU à coût équivalent pour certaines charges.
Cerebras : Architecture de puce à l'échelle du wafer qui intègre un wafer de silicium entier dans un seul processeur. Récemment déposé pour une introduction en bourse. Positionnement fort pour les charges d'entraînement où la taille du modèle dépasse les limites de mémoire d'un seul GPU.

La logique de valorisation

Les entreprises d'infrastructure du cycle IA se négocient à des multiples de revenus 2 à 3 fois supérieurs aux références historiques des logiciels — et pour des raisons défendables. L'infrastructure IA est rare (offre contrainte), intensive en capital (barrières à l'entrée élevées) et collante (les coûts de changement sont réels). Ce sont les conditions qui justifient des multiples élevés.

La valorisation de CoreWeave à 23 milliards de dollars sur un ARR d'environ 4 milliards implique un multiple de 5 à 6x les revenus. Cela paraît élevé jusqu'à ce qu'on le compare à AWS, qui se négocie à environ 7x sur une activité plus diversifiée et mature. La couche infrastructure est peut-être mieux positionnée que la couche modèle sur un horizon de 3 à 5 ans : les modèles se commoditisent à mesure que les alternatives open-weight comblent l'écart, mais le calcul ne se commoditise pas. Le coût d'une heure de GPU ne baisse pas simplement parce qu'un nouveau LLM arrive.

Conclusion

Le boom de l'IA est réel, et la vague de Capex ne fait que commencer — les dépenses des hyperscalers s'accélèrent, ne plafonnent pas. Mais les paris les plus sûrs dans ce cycle ne portent pas sur quel LLM gagnera le prochain Benchmark. Ils portent sur les entreprises qui sont payées quel que soit le gagnant.

Infrastructures électriques, ASIC pour le réseau IA, silicium personnalisé, mémoire HBM, lithographie EUV et clouds GPU spécialisés : tous bénéficient de la vague de Capex, que GPT-5, Claude 4 ou Gemini Ultra domine en 2027. Les entreprises de modèles brûlent du capital pour se différencier. La couche infrastructure encaisse les loyers.