O que diferencia essa parceria de um projeto de ASIC comum é a sua ambição. FuriosaAI e Broadcom não estão apenas projetando um chip mais rápido; estão construindo uma plataforma de inferência unificada em escala de rack que resolve os gargalos sistêmicos dos hiperescaláveis data centers de IA .
Charlie Kawwas, presidente da Divisão de Soluções de Semicondutores da Broadcom, contextualizou a parceria com foco em performance sistêmica: "O desempenho da inferência não é mais definido apenas pela computação bruta... Ao unir a arquitetura TCP da Furiosa à nossa plataforma de tecnologia XPU, IP e switches de rede, estamos criando uma plataforma que ataca os principais gargalos da IA agêntica em larga escala" . A topologia do sistema está sendo construída para ser "todos-para-todos" (all-to-all), capaz de lidar com os complexos padrões de comunicação exigidos por modelos de IA do tipo Mistura de Especialistas (MoE)
.
A FuriosaAI entra nessa parceria com silício comercial já comprovado. Seu chip de segunda geração, chamado RNGD, já está em produção em massa no processo de 5nm da TSMC . O RNGD é um cartão PCIe de 180W de TDP (Thermal Design Power, ou potência térmica de projeto) que oferece 512 teraFLOPS de desempenho FP8 com 48GB de memória HBM3 e 1,5 TB/s de largura de banda. Isso representa cerca de 1/9 do pico computacional de uma Nvidia B200, mas o faz consumindo aproximadamente 1/5 da energia
. Um foco claro em eficiência energética.
O RNGD já foi validado por grandes empresas coreanas, incluindo a Samsung SDS e a LG AI Research, onde a LG está usando o hardware para rodar sua família de modelos de IA, Exaone . Essa tração comercial dá à startup uma base de credibilidade para agora mirar no mercado global de data centers hyperscale com sua plataforma de terceira geração.
Um diferencial central é o software. O kit de desenvolvimento da FuriosaAI (SDK) usa um compilador universal que mapeia automaticamente o código PyTorch para o seu silício, eliminando a necessidade de kernels CUDA ajustados manualmente. Além disso, sua ISA Virtual oferece aos desenvolvedores controle de baixo nível sem a complexidade de programar para GPUs .
A filosofia de design da FuriosaAI argumenta que as GPUs tradicionais carregam um "imposto de legado" de suas origens gráficas. Sua arquitetura SIMT, segundo a empresa, sofre com os padrões irregulares de acesso à memória, comuns nas cargas de trabalho modernas de inferência de IA. Em contrapartida, o seu Processador de Contração de Tensores (TCP) é uma arquitetura projetada do zero, que prioriza a movimentação de dados em alta largura de banda e operações massivas de tensores em vez do gerenciamento de threads, visando um desempenho-por-watt superior e maior densidade de tokens em racks com restrição de energia .
O acordo com a FuriosaAI é o mais recente movimento numa estratégia abrangente de silício customizado da Broadcom. Em outubro de 2025, a OpenAI anunciou uma parceria de longo prazo com a Broadcom para co-desenvolver e implementar impressionantes 10 gigawatts de aceleradores de IA customizados e hardware de rede, com a primeira implementação prevista para o segundo semestre de 2026, usando designs de 3nm e 2nm . O portfólio de parceiros de ASIC da Broadcom também inclui Microsoft, Amazon, Meta e Google — todas investindo bilhões para projetar chips específicos para suas necessidades de IA
.
Esta onda de parcerias reflete uma mudança estrutural no mercado. De acordo com a consultoria TrendForce, os servidores de IA baseados em ASIC devem responder por 27,8% do total de remessas de servidores de IA em 2026, uma alta de vários anos, com a previsão de crescer para quase 40% do mercado até 2030 . A taxa de crescimento dos chips de IA customizados é reveladora: dados da TrendForce mostram que as remessas desses chips por provedores de nuvem devem crescer 44,6% em 2026, quase o triplo da taxa de crescimento de 16,1% projetada para GPUs comerciais
.
Embora a Nvidia ainda detenha cerca de 70% do mercado de chips de IA, espera-se que essa fatia diminua à medida que os gigantes da nuvem migram para silício customizado que oferece mais eficiência para seus softwares únicos . A plataforma FuriosaAI–Broadcom aposta diretamente nessa tendência, tentando saltar de um chip de inferência de 180W já validado para um sistema de 2nm, baseado em rede Ethernet, projetado para os maiores data centers do mundo.
Comments
0 comments