Além dos aceleradores de IA, a ByteDance está se movendo para garantir sua base de computação de uso geral. A Reuters noticiou, em 28 de maio de 2026, que a empresa está desenvolvendo suas próprias CPUs de servidor usando duas trilhas de arquitetura paralelas: uma baseada em Arm e outra no conjunto de instruções de código aberto RISC-V .
A motivação é um clássico cálculo de "fazer versus comprar", tornado urgente pelas dores na cadeia de suprimentos. Intel e AMD supostamente aumentaram os preços das CPUs de servidor em 10% a 35% nos últimos meses, com a Intel alertando clientes chineses sobre atrasos de entrega de seis meses . Para uma empresa que planeja uma implementação massiva de serviços baseados em agentes, essas são restrições inaceitáveis. As CPUs personalizadas da ByteDance são destinadas aos seus próprios data centers para dar suporte a operações internas e plataformas como o Coze, seu ambiente de desenvolvimento de agentes de IA
. A abordagem de duas arquiteturas funciona como uma proteção, permitindo que a ByteDance avalie qual design se adapta melhor às suas necessidades de longo prazo em termos de desempenho, custo e resiliência geopolítica
.
Em 26 de maio de 2026, a Bloomberg informou que a Qualcomm havia fechado um acordo para fornecer à ByteDance milhões de circuitos integrados de aplicação específica (ASICs) personalizados para seus data centers de IA . Esta não é uma simples compra de chips. Vários relatórios esclarecem que o acordo é um contrato combinado de aquisição e fabricação, onde a Qualcomm ajudará a transformar os designs internos de chips da ByteDance em silício produzível em massa, usando fundições como a TSMC
.
O principal caso de uso para esses ASICs é alimentar o software de agente de IA da ByteDance, mais notavelmente seu agente de IA 'Doubao' . Esta parceria é uma vitória significativa para a Qualcomm, que se expande de processadores para smartphones para o mercado de data centers de IA, e fornece à ByteDance um pipeline de silício personalizado e otimizado para carga de trabalho que opera dentro dos limites da conformidade de exportação dos EUA, uma estratégia que alguns relatórios chamam de "design de conformidade pixel-perfeito"
.
Sustentando esses movimentos recentes está uma parceria fundamental mais antiga. A ByteDance vem trabalhando com a Broadcom e a TSMC para co-desenvolver GPUs de IA personalizadas, frequentemente referenciadas sob o codinome "SeedChip". Relatórios de 2024 indicavam que a ByteDance estava trabalhando com a TSMC para fabricar dois chips de IA em um processo de 5nm – um para treinamento e outro para inferência – com produção em massa esperada para 2026 . Embora houvesse relatórios conflitantes na época, com a ByteDance negando planos de substituir a Nvidia no curto prazo
, a enxurrada subsequente de atividades com CPUs e LPUs mostra que a estratégia de silício personalizado apenas se aprofundou e expandiu.
A ByteDance é agora um cliente confirmado da plataforma de silício de IA personalizada da Broadcom, que utiliza técnicas avançadas de empacotamento 3.5D, colocando a dona do TikTok em um seleto grupo de clientes de chips customizados ao lado de Google e Meta .
Essas estratégias de chips não são exercícios acadêmicos; elas são a base da infraestrutura para um roteiro de produtos de IA extraordinariamente ambicioso. O orçamento de IA da ByteDance para 2026 é estimado em cerca de 160 bilhões de yuan (aproximadamente R$ 112 bilhões), um aumento em relação aos 150 bilhões de yuan em 2025, com 85 bilhões de yuan especificamente destinados a processadores de IA .
Este gasto é impulsionado pela economia da inferência. À medida que produtos baseados em agentes de IA, como Coze e Doubao, são dimensionados para centenas de milhões de usuários, o custo por token para gerar respostas torna-se a principal métrica de negócio. Comprar milhões de GPUs caras e com oferta restrita da Nvidia é um risco financeiro e estratégico. Desenvolver chips personalizados ao estilo LPU para inferência de baixo custo, CPUs personalizadas para evitar os aumentos de preços da arquitetura x86 e ASICs personalizados para cargas de trabalho de agentes é um ataque direto a esse risco.
A estratégia da ByteDance é melhor compreendida não como uma tentativa de "substituir a Nvidia", mas como um desacoplamento metódico. Usar o hardware da Nvidia onde ele está disponível e é imbatível, como para o treinamento de modelos de ponta, enquanto constrói toda uma pilha paralela de silício personalizado para as cargas de trabalho de inferência de alto volume das quais o negócio dependerá cada vez mais. É um plano multifacetado para a soberania computacional de IA em uma era de fragmentação tecnológica.
Comments
0 comments