Rasgon apontou que os quatro maiores hiperscaladores dos EUA – Amazon, Microsoft, Google e Meta – planejam gastar cerca de US$ 725 bilhões em despesas de capital em 2026, com a maior parte indo para infraestrutura de IA . Os preços de memória dispararam verticalmente: os preços de DRAM subiram aproximadamente 90% trimestre a trimestre no início de 2026
.
Uma das observações mais impressionantes de Rasgon é o que ele chama de efeito 'whack-a-mole' – gargalos se propagando por toda a cadeia de suprimentos de chips. 'Tudo está sendo puxado por essa demanda insaciável por computação de IA. Nunca vi nada nessa escala em minha carreira', disse Rasgon .
Ele traçou a propagação: a escassez começou com aceleradores GPU, depois passou para a memória HBM, em seguida para equipamentos de fabricação de semicondutores, depois para redes e óptica, depois para chips de energia, e agora até mesmo as CPUs estão em falta .
Um exemplo concreto do alcance da demanda: até mesmo a Intel, que tinha 'estoque previamente zerado', vendeu tudo . Clientes supostamente disseram à Intel: 'Não nos importamos; apenas venda para nós'
.
Um gargalo crítico é a memória de alta largura de banda (HBM), que representa mais de 85% da área de silício de um chip de IA . Devido aos rendimentos de empilhamento e à sobrecarga do dado lógico, fabricar 1 GB de HBM requer aproximadamente quatro vezes a área de silício da DRAM padrão
. Essa matemática explica por que a oferta de memória não conseguiu acompanhar a demanda por GPU e por que os preços da memória se tornaram um fator dominante nos custos dos chips.
Rasgon destacou um ponto de dados surpreendente: em um rack de 72 GPUs, as 36 CPUs dentro geram cerca de US$ 20 bilhões em receita de CPU para a Nvidia. Isso ilustra como a construção da IA está criando uma demanda massiva por chips muito além dos próprios aceleradores GPU.
Rasgon enfatizou que o foco do mercado está se movendo do treinamento de modelos para a inferência de IA – o caminho central para a monetização . Ele citou a receita da Anthropic saltando de US$ 9 bilhões para US$ 30 bilhões como evidência direta dessa mudança
. À medida que os modelos de IA passam de projetos de pesquisa para produção, a computação necessária para inferência provavelmente ofuscará as cargas de trabalho de treinamento.
Uma pergunta comum dos investidores é se os ASICs personalizados (como os feitos pela Broadcom) acabarão por deslocar as GPUs da Nvidia. Rasgon acredita que ambos coexistirão a longo prazo em um mercado em crescimento . Sua estrutura: GPUs programáveis são mais adequadas para pesquisa e inferência exploratória, enquanto ASICs se destacam em cargas de trabalho de inferência previsíveis e de alto volume. O mercado total endereçável é grande o suficiente para absorver ambos.
Rasgon concluiu com uma nota sóbria. A restrição final não são chips, nem memória, nem rede – é a energia. A infraestrutura de IA requer aproximadamente um aumento anual de 5% na capacidade da rede elétrica dos EUA para sustentar a trajetória de crescimento . Isso é uma demanda impressionante em uma rede que viu um crescimento mínimo de capacidade por décadas.
Ele argumentou que a próxima onda de inovação e gargalos de IA inevitavelmente recairá sobre a geração de energia, resfriamento e energia nuclear . Sem um investimento significativo na rede, o próprio supercíclico pode atingir um teto de energia.
A mensagem de Rasgon é clara: enquanto a demanda por IA não entrar em colapso, o supercíclico de semicondutores é real e sustentável. Mas a natureza da oportunidade está mudando. O dinheiro fácil em ações de GPU pode estar dando lugar a um cenário mais complexo, onde o próprio 'gargalo' – seja em HBM, chips de energia ou infraestrutura de energia – se torna o gerador de riqueza .
Comments
0 comments