RespuestasPublicadohace 2 mesesLast edited el mes pasado21 fuentes

La jugada de FuriosaAI y Broadcom: Un sistema a 2nm que planta cara a los gigantes de las GPU

FuriosaAI y Broadcom codesarrollan un chip de inferencia de IA a 2nm de tercera generación como una plataforma completa a escala de rack —no solo un chip— integrando el empaquetado 3.5D de Broadcom, memoria HBM4/4E y... La plataforma está diseñada para cargas de trabajo de IA agéntica en hiperescala y combina la arq...

Buscar y verificar hechos con Studio Global AI Explora más páginas en tendencia

FuriosaAI and Broadcom third-generation 2nm AI inference chip platform concept — What are the key details of the strategic partnership between FuriosaAI and Broadcom to co-develop a third-generation 2nm AI inference chipA conceptual rendering of the third-generation AI inference chiplet being co-developed by FuriosaAI and Broadcom.
Prompt de IA
Create a landscape editorial hero image for this Studio Global article: What are the key details of the strategic partnership between FuriosaAI and Broadcom to co-develop a third-generation 2nm AI inference chip. Article summary: Here is a comprehensive breakdown of the FuriosaAI–Broadcom partnership, structured around each of your questions.. Topic tags: general, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# FuriosaAI partners with Broadcom on third AI inference platform. FuriosaAI, a builder of high-performance inference silicon, announced a strategic partnership with big chip maker" source context "FuriosaAI partners with Broadcom on third AI inference platform" Reference image 2: visual subject "# FuriosaAI partners with Broadcom on third AI inference platform. FuriosaAI, a builder of high-performance inference
openai.com

Está en marcha un cambio radical en el hardware que impulsa la inteligencia artificial. El 27 de mayo de 2026, la startup surcoreana de silicio para IA, FuriosaAI, anunció una alianza estratégica con el gigante de los semiconductores Broadcom para desarrollar conjuntamente su acelerador de IA de tercera generación . El acuerdo supone un paso de gigante en el alejamiento de la industria del modelo único de GPU hacia una infraestructura altamente especializada y personalizada, diseñada específicamente para la inferencia de IA a escala masiva.

El nuevo chip representa un salto desde una simple tarjeta aceleradora a un sistema completo a escala de rack diseñado para la nueva era de la IA. Se construirá sobre un dado de cómputo de 2nm con memoria HBM4 o HBM4E de "doble capa", posible gracias al empaquetado avanzado de Broadcom . El diseño utiliza la tecnología 3.5D XDSiP (Extreme Dimension System in Package) de Broadcom para separar el cómputo, la memoria, la E/S y la lógica en distintos chiplets y ensamblarlos mediante técnicas 3D avanzadas como la unión híbrida . Está previsto que el muestreo comience en el primer semestre de 2028 .

Mucho más que un chip: una plataforma de inferencia completa a escala de rack

Lo que diferencia esta alianza de un diseño ASIC estándar es su alcance. FuriosaAI y Broadcom no solo están diseñando un chip más rápido; están construyendo una plataforma de inferencia unificada a escala de rack que aborda todos los cuellos de botella a nivel de sistema de los centros de datos de IA en hiperescala .

La plataforma integra varias capas de la tecnología de Broadcom además del empaquetado :

Plataforma IP y Tecnología XPU: Un marco de integración a nivel de sistema que simplifica el diseño de aceleradores complejos de múltiples dados.
Switches de Escalado y Tejido Ethernet: Incluye switches de alta densidad como el Tomahawk 6, lo que permite que los sistemas escalen sin problemas desde ocho chips a miles de nodos en racks enteros.
Tecnologías PCIe: Proporcionan las interconexiones de gran ancho de banda necesarias para mover cantidades ingentes de datos entre componentes.

Charlie Kawwas, presidente del Grupo de Soluciones de Semiconductores de Broadcom, enmarcó la alianza en torno al rendimiento a nivel de sistema: "El rendimiento de la inferencia ya no se define solo por el cómputo bruto... Al combinar la arquitectura TCP de Furiosa con la plataforma IP y tecnología XPU líder en el mercado de Broadcom, y nuestros switches de escalado y tejido Ethernet, estamos construyendo una plataforma que aborda los principales cuellos de botella de la IA agéntica a gran escala" . El sistema se está construyendo con una topología capaz de comunicación "todos con todos" para manejar los complejos patrones de comunicación que requieren los modelos de IA de Mezcla de Expertos (MoE) .

La posición de FuriosaAI: de tarjeta PCIe a contendiente en hiperescala

FuriosaAI llega a esta alianza con silicio comercial probado. Su chip de segunda generación, llamado RNGD, ya se produce en masa en el proceso de 5nm de TSMC . El RNGD es una tarjeta PCIe de 180W de TDP que ofrece 512 teraFLOPS de rendimiento en FP8 con 48GB de memoria HBM3 y 1.5 TB/s de ancho de banda. Si bien esto representa aproximadamente 1/9 del pico de cómputo de una Nvidia B200, lo hace con cerca de 1/5 del consumo energético .

El RNGD ha sido validado por importantes empresas coreanas, incluidas Samsung SDS y LG AI Research; esta última ya ejecuta su familia de modelos Exaone en este hardware . Esta tracción comercial proporciona a la startup una base de credibilidad mientras apunta al mercado global de hiperescala con su plataforma de tercera generación.

Un diferenciador clave es la pila de software de FuriosaAI. El SDK de la compañía utiliza un compilador general que mapea automáticamente el código PyTorch directamente a su silicio, evitando la necesidad de kernels CUDA ajustados manualmente. Su ISA Virtual (Virtual ISA) ofrece a los desarrolladores un control de bajo nivel sin la complejidad de la programación de GPU .

La filosofía de diseño de FuriosaAI sostiene que las GPU tradicionales arrastran un "lastre heredado" de sus orígenes gráficos. Su arquitectura SIMT, argumenta la empresa, tiene dificultades con los patrones irregulares de acceso a la memoria, comunes en las cargas de trabajo modernas de inferencia de IA. Su Procesador de Contracción Tensorial (TCP) es una arquitectura de diseño limpio que prioriza el movimiento de datos de gran ancho de banda y las operaciones tensoriales masivas sobre la gestión de hilos, con el objetivo de ofrecer un rendimiento por vatio y una densidad de tokens superiores en racks de centros de datos con limitaciones de energía .

El contexto general: una revolución del ASIC personalizado

El acuerdo con FuriosaAI es la última pieza de una ambiciosa estrategia de silicio personalizado por parte de Broadcom. En octubre de 2025, OpenAI anunció una alianza plurianual con Broadcom para codesarrollar y desplegar la asombrosa cifra de 10 gigavatios de aceleradores de IA y hardware de red personalizados, con el primer despliegue previsto para el segundo semestre de 2026, utilizando diseños tanto de 3nm como de 2nm . La lista de socios de ASIC personalizados de Broadcom también incluye a Microsoft, Amazon, Meta y Google, todos los cuales están invirtiendo miles de millones para diseñar chips a medida para sus cargas de trabajo de IA específicas .

Esta ola de alianzas refleja un cambio estructural en el mercado. Según la firma de investigación TrendForce, se proyecta que los servidores de IA basados en ASIC representen el 27,8% del total de envíos de servidores de IA en 2026, un máximo de varios años, y se prevé que crezcan hasta casi el 40% del mercado para 2030 . La tasa de crecimiento de los chips de IA personalizados es reveladora: los datos de TrendForce muestran que los envíos de chips de IA personalizados de proveedores de nube van camino de crecer un 44,6% en 2026, casi el triple de la tasa de crecimiento del 16,1% proyectada para las GPU comerciales .

Aunque Nvidia aún posee aproximadamente el 70% del mercado de chips de IA, se espera que su cuota disminuya a medida que los operadores de hiperescala giren hacia el silicio personalizado, que puede ofrecer una mejor eficiencia para sus pilas de software particulares . La plataforma FuriosaAI–Broadcom es una apuesta directa en esta tendencia, con la que se intenta dar el salto desde una tarjeta de inferencia validada de 180W a un sistema a 2nm basado en tejido Ethernet, diseñado para los centros de datos más grandes del mundo.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Buscar y verificar hechos con Studio Global AI

La gente también pregunta

¿Cuál es la respuesta corta a "La jugada de FuriosaAI y Broadcom: Un sistema a 2nm que planta cara a los gigantes de las GPU"?

¿Cuáles son los puntos clave a validar primero?

¿Qué debo hacer a continuación en la práctica?

Este acuerdo es el último de una ola creciente de alianzas de ASIC personalizados, lo que señala un giro en la industria que se aleja de las GPU de propósito general: se prevé que los servidores basados en ASIC captur...

Fuentes

← Back to Trending