Lo que diferencia esta alianza de un diseño ASIC estándar es su alcance. FuriosaAI y Broadcom no solo están diseñando un chip más rápido; están construyendo una plataforma de inferencia unificada a escala de rack que aborda todos los cuellos de botella a nivel de sistema de los centros de datos de IA en hiperescala .
Charlie Kawwas, presidente del Grupo de Soluciones de Semiconductores de Broadcom, enmarcó la alianza en torno al rendimiento a nivel de sistema: "El rendimiento de la inferencia ya no se define solo por el cómputo bruto... Al combinar la arquitectura TCP de Furiosa con la plataforma IP y tecnología XPU líder en el mercado de Broadcom, y nuestros switches de escalado y tejido Ethernet, estamos construyendo una plataforma que aborda los principales cuellos de botella de la IA agéntica a gran escala" . El sistema se está construyendo con una topología capaz de comunicación "todos con todos" para manejar los complejos patrones de comunicación que requieren los modelos de IA de Mezcla de Expertos (MoE)
.
FuriosaAI llega a esta alianza con silicio comercial probado. Su chip de segunda generación, llamado RNGD, ya se produce en masa en el proceso de 5nm de TSMC . El RNGD es una tarjeta PCIe de 180W de TDP que ofrece 512 teraFLOPS de rendimiento en FP8 con 48GB de memoria HBM3 y 1.5 TB/s de ancho de banda. Si bien esto representa aproximadamente 1/9 del pico de cómputo de una Nvidia B200, lo hace con cerca de 1/5 del consumo energético
.
El RNGD ha sido validado por importantes empresas coreanas, incluidas Samsung SDS y LG AI Research; esta última ya ejecuta su familia de modelos Exaone en este hardware . Esta tracción comercial proporciona a la startup una base de credibilidad mientras apunta al mercado global de hiperescala con su plataforma de tercera generación.
Un diferenciador clave es la pila de software de FuriosaAI. El SDK de la compañía utiliza un compilador general que mapea automáticamente el código PyTorch directamente a su silicio, evitando la necesidad de kernels CUDA ajustados manualmente. Su ISA Virtual (Virtual ISA) ofrece a los desarrolladores un control de bajo nivel sin la complejidad de la programación de GPU .
La filosofía de diseño de FuriosaAI sostiene que las GPU tradicionales arrastran un "lastre heredado" de sus orígenes gráficos. Su arquitectura SIMT, argumenta la empresa, tiene dificultades con los patrones irregulares de acceso a la memoria, comunes en las cargas de trabajo modernas de inferencia de IA. Su Procesador de Contracción Tensorial (TCP) es una arquitectura de diseño limpio que prioriza el movimiento de datos de gran ancho de banda y las operaciones tensoriales masivas sobre la gestión de hilos, con el objetivo de ofrecer un rendimiento por vatio y una densidad de tokens superiores en racks de centros de datos con limitaciones de energía .
El acuerdo con FuriosaAI es la última pieza de una ambiciosa estrategia de silicio personalizado por parte de Broadcom. En octubre de 2025, OpenAI anunció una alianza plurianual con Broadcom para codesarrollar y desplegar la asombrosa cifra de 10 gigavatios de aceleradores de IA y hardware de red personalizados, con el primer despliegue previsto para el segundo semestre de 2026, utilizando diseños tanto de 3nm como de 2nm . La lista de socios de ASIC personalizados de Broadcom también incluye a Microsoft, Amazon, Meta y Google, todos los cuales están invirtiendo miles de millones para diseñar chips a medida para sus cargas de trabajo de IA específicas
.
Esta ola de alianzas refleja un cambio estructural en el mercado. Según la firma de investigación TrendForce, se proyecta que los servidores de IA basados en ASIC representen el 27,8% del total de envíos de servidores de IA en 2026, un máximo de varios años, y se prevé que crezcan hasta casi el 40% del mercado para 2030 . La tasa de crecimiento de los chips de IA personalizados es reveladora: los datos de TrendForce muestran que los envíos de chips de IA personalizados de proveedores de nube van camino de crecer un 44,6% en 2026, casi el triple de la tasa de crecimiento del 16,1% proyectada para las GPU comerciales
.
Aunque Nvidia aún posee aproximadamente el 70% del mercado de chips de IA, se espera que su cuota disminuya a medida que los operadores de hiperescala giren hacia el silicio personalizado, que puede ofrecer una mejor eficiencia para sus pilas de software particulares . La plataforma FuriosaAI–Broadcom es una apuesta directa en esta tendencia, con la que se intenta dar el salto desde una tarjeta de inferencia validada de 180W a un sistema a 2nm basado en tejido Ethernet, diseñado para los centros de datos más grandes del mundo.
Comments
0 comments