Os verdadeiros vencedores do boom da IA não são as empresas de IA — é a camada de infraestrutura | IRCNF - Intelligent Reliable Custom Next-gen Frameworks

Toda corrida do ouro enriquece quem vende pás. O superciclo de IA de 2024–2026 segue o mesmo padrão — enquanto OpenAI, Anthropic e Google discutem qual modelo é mais inteligente, as empresas que vendem GPUs, redes, energia, refrigeração e infraestrutura de nuvem estão registrando receitas recordes com margens robustas. Aqui está a camada de infraestrutura que está realmente gerando dinheiro.

A domínio sustentado da Nvidia

A receita de data center da Nvidia atingiu US$ 35,6 bilhões em um único trimestre (Q1 do ano fiscal de 2026) — um número que teria parecido fictício cinco anos atrás. A transição da arquitetura H100/H200 para a Blackwell está bem encaminhada, com os racks GB200 NVL72 custando mais de US$ 3 milhões cada e ainda com pedidos em atraso por trimestres.

O grande salto de engenharia na Blackwell é o NVLink 5, que oferece 1,8 TB/s de largura de banda entre GPUs. Isso permite que um cluster de inferência com 72 GPUs se comporte como um único acelerador gigante — algo essencial para servir modelos grandes, onde a latência de comunicação entre GPUs era um gargalo crítico. A demanda continua superando a oferta por uma margem ampla, dando à Nvidia um poder de precificação extraordinário.

A AMD MI300X é uma concorrente de verdade — já ultrapassou US$ 5 bilhões em receita anual e está conquistando implantações significativas em hiperescaladores e provedores de nuvem. Mas o ecossistema CUDA da Nvidia, construído ao longo de 15 anos de ferramentas para desenvolvedores, integração de frameworks e bibliotecas de software, continua sendo o principal fosso. Migrar de CUDA para ROCm exige um investimento real em engenharia, e a maioria dos times de IA não faz essa troca a menos que a economia de custos seja esmagadora.

O jogo de redes — Ethernet vs. InfiniBand

Redes são o gargalo invisível na construção de clusters de IA. O InfiniBand, originalmente desenvolvido para HPC e agora controlado pela Nvidia (via aquisição da Mellanox em 2020), domina os clusters de treinamento de IA de alto desempenho. Sua malha de baixa latência e alta taxa de transferência foi projetada especificamente para as operações all-reduce das quais o treinamento distribuído depende.

Mas os hiperescaladores estão reagindo. Google, Microsoft e Meta estão construindo redes de IA baseadas em Ethernet usando a especificação do Ultra Ethernet Consortium (UEC) — um esforço colaborativo para trazer desempenho no nível do InfiniBand para Ethernet padrão a um custo menor e sem dependência de fornecedor. Isso cria uma grande oportunidade para Arista Networks (switches de alta radix), Broadcom (ASIC Tomahawk 5, que entrega 51,2 Tbps por chip) e Cisco.

A Broadcom projetou mais de US$ 60 bilhões em receita acumulada de ASICs para redes de IA até 2027 — um número que reflete tanto o crescimento orgânico quanto a transição dos hiperescaladores para Ethernet. O silício personalizado está acelerando essa mesma tendência: os TPUs do Google, o AWS Trainium 2 e o Maia 100 da Microsoft estão todos reduzindo a dependência da Nvidia para cargas de treinamento, enquanto direcionam gastos para seus próprios chips e para os fornecedores de rede que os conectam.

Energia e refrigeração — o gargalo esquecido

Um único rack GB200 NVL72 consome 120 kW de energia. Um cluster de 1.000 GPUs mantém 1,67 MW continuamente — aproximadamente o consumo de 1.400 residências americanas típicas, funcionando 24 horas por dia, 7 dias por semana. Nessa densidade, a restrição não são mais as GPUs. É o fornecimento de energia e o gerenciamento térmico.

Data centers com refrigeração a ar tradicional atingem o máximo de cerca de 20 a 30 kW por rack. Instalações otimizadas para IA precisam de refrigeração líquida direta (DLC) — tubos de líquido refrigerante que vão diretamente ao chassi do servidor, removendo o calor na fonte. A Vertiv é uma das principais beneficiadas, fornecendo sistemas de refrigeração líquida e infraestrutura de refrigeração de precisão globalmente. A Eaton fornece nobreaks (UPS) e unidades de distribuição de energia (PDU) no nível do rack e da fileira. As células a combustível no local da Bloom Energy estão cada vez mais sendo implantadas para complementar a energia da rede em instalações de escala de IA.

Os REITs de data centers estão se beneficiando da escassez estrutural de oferta. Equinix e Digital Realty estão construindo campuses otimizados para IA do zero — projetados para densidades de 50 a 100 kW por rack com DLC incorporada desde a fundação. O ponto crucial: um novo data center pronto para IA de 100 MW leva de 18 a 24 meses para ser licenciado, projetado e construído. Esse atraso cria um poder de precificação significativo para operadores existentes com capacidade disponível hoje.

A explosão de Capex dos hiperescaladores de nuvem

A escala dos gastos dos hiperescaladores é difícil de exagerar. A Microsoft se comprometeu com US$ 80 bilhões em despesas de capital em 2026, principalmente para infraestrutura de IA. O Google orientou US$ 75 bilhões. O valor da Amazon é o maior, com US$ 105 bilhões. Esses não são compromissos de marketing — eles aparecem nos resultados trimestrais como gastos concretos com construção e equipamentos.

O dinheiro flui para um conjunto concentrado de fornecedores. A TSMC fabrica os chips H20 e B200 e lida com o empacotamento avançado CoWoS (Chip-on-Wafer-on-Substrate) que empilha a memória HBM diretamente no die da GPU. A capacidade do CoWoS tem sido um gargalo relatado na produção do GB200 — a TSMC opera em capacidade total e expande a capacidade em um ritmo que ainda fica atrás da demanda.

A SK hynix e a Samsung fornecem HBM3 e HBM3E, as memórias de alta largura de banda que tornam possíveis os aceleradores de IA modernos. A ASML fornece as máquinas de litografia EUV, sem as quais os chips de ponta não podem ser fabricados. Toda a cadeia de suprimentos está operando a todo vapor — e como cada elo leva anos para ser expandido, o poder de precificação dos fornecedores com restrições de oferta persistirá até 2027.

A camada de startups — pás e picaretas de infraestrutura

Abaixo do nível dos hiperescaladores, uma onda de startups de infraestrutura está capturando a demanda que Amazon, Microsoft e Google não conseguem ou não querem atender:

CoreWeave: A startup de nuvem de GPU mais observada. Levantou US$ 11,9 bilhões com valuation de US$ 23 bilhões em 2025, construída sobre uma frota de H100s da Nvidia alugados para empresas de IA a taxas premium. Lucrativa por GPU e expandindo agressivamente para hardware Blackwell.
Lambda Labs: Nuvem de GPU focada em IA com US$ 320 milhões captados. Atende pesquisadores e times de IA de médio porte que não conseguem cotas em hiperescaladores — um problema real dadas as listas de espera da AWS e do Azure.
Together AI: Startup de API de inferência especializada em servir múltiplos modelos de forma otimizada. Oferece acesso a modelos de pesos abertos (Llama, Mistral, etc.) com preços competitivos por token e foco em throughput.
Modal: Computação GPU serverless para desenvolvedores. Abstrai o gerenciamento de clusters — você escreve Python, a Modal cuida do provisionamento, escalonamento e cobrança por segundo de uso real de GPU.
Groq: Construiu a LPU (Language Processing Unit), um chip projetado especificamente para inferência. Alega mais de 500 tokens/segundo em modelos da classe Llama — significativamente mais rápido que inferência baseada em GPU a custo equivalente para certas cargas de trabalho.
Cerebras: Arquitetura de chip em escala de wafer que empacota uma bolacha inteira de silício em um único processador. Recentemente pediu IPO. Forte posicionamento para cargas de treinamento onde o tamanho do modelo excede os limites de memória de uma única GPU.

A matemática da valuation

Empresas de infraestrutura no ciclo de IA estão sendo negociadas a múltiplos de receita 2 a 3 vezes maiores que os benchmarks históricos de software — e por razões defensáveis. Infraestrutura de IA é escassa (com oferta restrita), intensiva em capital (altas barreiras de entrada) e aderente (os custos de troca são reais). Essas são as condições que justificam múltiplos premium.

O valuation de US$ 23 bilhões da CoreWeave sobre aproximadamente US$ 4 bilhões de ARR implica um múltiplo de receita de 5 a 6 vezes. Isso parece alto até comparar com a AWS, que é negociada a aproximadamente 7 vezes em um negócio mais diversificado e maduro. A camada de infraestrutura pode estar melhor posicionada que a camada de modelos em um horizonte de 3 a 5 anos: modelos se commoditizam conforme alternativas de pesos abertos fecham a lacuna, mas computação não. O custo de uma GPU-hora não cai só porque um novo LLM chega.

Conclusão

O boom da IA é real, e a onda de capex está apenas começando — os gastos dos hiperescaladores estão acelerando, não estabilizando. Mas as apostas mais seguras neste ciclo não estão em qual LLM vencerá o próximo benchmark. Elas estão nas empresas que recebem, independentemente de quem vencer.

Infraestrutura de energia, ASICs para redes de IA, silício personalizado, memória HBM, litografia EUV e nuvens especializadas em GPU se beneficiam da onda de capex, quer o GPT-5, Claude 4 ou Gemini Ultra domine em 2027. As empresas de modelos estão queimando capital para se diferenciar. A camada de infraestrutura está coletando aluguel.