RespostasPublicadohá 2 mesesLast edited mês passado21 fontes

A aposta de 2nm da FuriosaAI e Broadcom contra a hegemonia das GPUs em IA

FuriosaAI e Broadcom estão co desenvolvendo um chip de inferência de IA de 2nm como uma plataforma completa em escala de rack — não apenas um chip — integrando packaging 3.5D da Broadcom, memória HBM4/4E e switches de... A plataforma é projetada para cargas de trabalho de IA agêntica em hyperscale e combina a arquit...

Pesquisar e verificar fatos com Studio Global AI Veja mais páginas em alta

FuriosaAI and Broadcom third-generation 2nm AI inference chip platform concept — What are the key details of the strategic partnership between FuriosaAI and Broadcom to co-develop a third-generation 2nm AI inference chipA conceptual rendering of the third-generation AI inference chiplet being co-developed by FuriosaAI and Broadcom.
Prompt de IA
Create a landscape editorial hero image for this Studio Global article: What are the key details of the strategic partnership between FuriosaAI and Broadcom to co-develop a third-generation 2nm AI inference chip. Article summary: Here is a comprehensive breakdown of the FuriosaAI–Broadcom partnership, structured around each of your questions.. Topic tags: general, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# FuriosaAI partners with Broadcom on third AI inference platform. FuriosaAI, a builder of high-performance inference silicon, announced a strategic partnership with big chip maker" source context "FuriosaAI partners with Broadcom on third AI inference platform" Reference image 2: visual subject "# FuriosaAI partners with Broadcom on third AI inference platform. FuriosaAI, a builder of high-performance inference
openai.com

Uma grande transformação está em curso no hardware que alimenta a inteligência artificial. No dia 27 de maio de 2026, a startup sul-coreana de silício para IA, FuriosaAI, anunciou uma parceria estratégica com a gigante de semicondutores Broadcom para co-desenvolver seu acelerador de IA de terceira geração . O acordo é um passo significativo no movimento da indústria para longe do modelo de GPU único e em direção a uma infraestrutura altamente especializada e sob medida, projetada especificamente para inferência de IA em escala massiva.

O novo chip representa um salto de um único cartão acelerador para um sistema completo em nível de rack, projetado para a próxima era da IA. Ele será construído em um die de computação de 2 nanômetros (2nm) com memória HBM4 ou HBM4E de "camada dupla", viabilizada pelo empacotamento avançado da Broadcom, conhecido como 3.5D XDSiP . Esta tecnologia separa computação, memória, I/O e lógica em distintos "chiplets" e os monta usando técnicas 3D avançadas, como a "hybrid bonding", para máxima eficiência . O início da amostragem (envio de protótipos para teste) está previsto para o primeiro semestre de 2028 .

Muito Além de um Chip: Uma Plataforma de Inferência em Escala de Rack

O que diferencia essa parceria de um projeto de ASIC comum é a sua ambição. FuriosaAI e Broadcom não estão apenas projetando um chip mais rápido; estão construindo uma plataforma de inferência unificada em escala de rack que resolve os gargalos sistêmicos dos hiperescaláveis data centers de IA .

A plataforma integra várias camadas da tecnologia Broadcom, além do empacotamento já mencionado :

Tecnologia e Plataforma de IP XPU: Uma estrutura de integração em nível de sistema que simplifica o design de aceleradores complexos com múltiplos dies.
Switches Ethernet para Expansão e Fabrica: Inclui switches de alto desempenho, como o Tomahawk 6, permitindo que os sistemas escalem de forma contínua, de oito chips a milhares de nós em racks inteiros.
Tecnologias PCIe: Fornecendo as interconexões de alta largura de banda necessárias para mover as enormes quantidades de dados entre os componentes.

Charlie Kawwas, presidente da Divisão de Soluções de Semicondutores da Broadcom, contextualizou a parceria com foco em performance sistêmica: "O desempenho da inferência não é mais definido apenas pela computação bruta... Ao unir a arquitetura TCP da Furiosa à nossa plataforma de tecnologia XPU, IP e switches de rede, estamos criando uma plataforma que ataca os principais gargalos da IA agêntica em larga escala" . A topologia do sistema está sendo construída para ser "todos-para-todos" (all-to-all), capaz de lidar com os complexos padrões de comunicação exigidos por modelos de IA do tipo Mistura de Especialistas (MoE) .

A Posição da FuriosaAI: De um Cartão PCIe a um Concorrente Hyperscale

A FuriosaAI entra nessa parceria com silício comercial já comprovado. Seu chip de segunda geração, chamado RNGD, já está em produção em massa no processo de 5nm da TSMC . O RNGD é um cartão PCIe de 180W de TDP (Thermal Design Power, ou potência térmica de projeto) que oferece 512 teraFLOPS de desempenho FP8 com 48GB de memória HBM3 e 1,5 TB/s de largura de banda. Isso representa cerca de 1/9 do pico computacional de uma Nvidia B200, mas o faz consumindo aproximadamente 1/5 da energia . Um foco claro em eficiência energética.

O RNGD já foi validado por grandes empresas coreanas, incluindo a Samsung SDS e a LG AI Research, onde a LG está usando o hardware para rodar sua família de modelos de IA, Exaone . Essa tração comercial dá à startup uma base de credibilidade para agora mirar no mercado global de data centers hyperscale com sua plataforma de terceira geração.

Um diferencial central é o software. O kit de desenvolvimento da FuriosaAI (SDK) usa um compilador universal que mapeia automaticamente o código PyTorch para o seu silício, eliminando a necessidade de kernels CUDA ajustados manualmente. Além disso, sua ISA Virtual oferece aos desenvolvedores controle de baixo nível sem a complexidade de programar para GPUs .

A filosofia de design da FuriosaAI argumenta que as GPUs tradicionais carregam um "imposto de legado" de suas origens gráficas. Sua arquitetura SIMT, segundo a empresa, sofre com os padrões irregulares de acesso à memória, comuns nas cargas de trabalho modernas de inferência de IA. Em contrapartida, o seu Processador de Contração de Tensores (TCP) é uma arquitetura projetada do zero, que prioriza a movimentação de dados em alta largura de banda e operações massivas de tensores em vez do gerenciamento de threads, visando um desempenho-por-watt superior e maior densidade de tokens em racks com restrição de energia .

O Cenário Mais Amplo: Uma Revolução dos ASICs Customizados

O acordo com a FuriosaAI é o mais recente movimento numa estratégia abrangente de silício customizado da Broadcom. Em outubro de 2025, a OpenAI anunciou uma parceria de longo prazo com a Broadcom para co-desenvolver e implementar impressionantes 10 gigawatts de aceleradores de IA customizados e hardware de rede, com a primeira implementação prevista para o segundo semestre de 2026, usando designs de 3nm e 2nm . O portfólio de parceiros de ASIC da Broadcom também inclui Microsoft, Amazon, Meta e Google — todas investindo bilhões para projetar chips específicos para suas necessidades de IA .

Esta onda de parcerias reflete uma mudança estrutural no mercado. De acordo com a consultoria TrendForce, os servidores de IA baseados em ASIC devem responder por 27,8% do total de remessas de servidores de IA em 2026, uma alta de vários anos, com a previsão de crescer para quase 40% do mercado até 2030 . A taxa de crescimento dos chips de IA customizados é reveladora: dados da TrendForce mostram que as remessas desses chips por provedores de nuvem devem crescer 44,6% em 2026, quase o triplo da taxa de crescimento de 16,1% projetada para GPUs comerciais .

Embora a Nvidia ainda detenha cerca de 70% do mercado de chips de IA, espera-se que essa fatia diminua à medida que os gigantes da nuvem migram para silício customizado que oferece mais eficiência para seus softwares únicos . A plataforma FuriosaAI–Broadcom aposta diretamente nessa tendência, tentando saltar de um chip de inferência de 180W já validado para um sistema de 2nm, baseado em rede Ethernet, projetado para os maiores data centers do mundo.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Pesquisar e verificar fatos com Studio Global AI

As pessoas também perguntam

Câu trả lời ngắn gọn cho "A aposta de 2nm da FuriosaAI e Broadcom contra a hegemonia das GPUs em IA" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Este anúncio é o mais recente em uma onda crescente de parcerias para ASICs customizados, sinalizando uma virada da indústria para longe das GPUs de propósito geral, já que servidores baseados em ASIC devem capturar 2...

Fontes

← Back to Trending