Ce qui distingue ce partenariat d'un simple contrat de conception de circuit intégré sur mesure (ASIC), c'est son ampleur. FuriosaAI et Broadcom ne se contentent pas de concevoir une puce plus rapide : ils construisent une plateforme d'inférence unifiée à l'échelle du rack – l'armoire de serveurs – qui s'attaque aux principaux goulots d'étranglement des centres de données IA hyperscale .
Charlie Kawwas, président de la division Semiconductor Solutions Group de Broadcom, a présenté ce partenariat sous l'angle de la performance système : « La performance d'inférence ne se définit plus seulement par la puissance de calcul brute [...] En associant l'architecture TCP de Furiosa à la plateforme IP et XPU de Broadcom, leader sur le marché, ainsi qu'à nos commutateurs Ethernet, nous construisons une plateforme qui répond aux principaux goulots d'étranglement de l'IA agentique à grande échelle » . Le système est conçu avec une topologie permettant une communication de type « tous-à-tous » (all-to-all) afin de gérer les schémas de communication complexes exigés par les modèles d'IA de type « mélange d'experts » (MoE)
.
FuriosaAI aborde ce partenariat avec un silicium commercial déjà éprouvé. Sa puce de deuxième génération, appelée RNGD, est déjà en production de masse sur le procédé 5 nm de TSMC . Le RNGD est une carte PCIe d'une puissance thermique de 180 W qui délivre 512 téraFLOPS en calcul FP8 avec 48 Go de mémoire HBM3 et une bande passante de 1,5 To/s. Bien que cela représente environ 1/9e de la puissance de calcul de pointe d'un Nvidia B200, la carte y parvient avec une consommation électrique environ 5 fois moindre
.
Le RNGD a été validé par de grandes entreprises coréennes, dont Samsung SDS et LG AI Research, ce dernier l'utilisant pour faire fonctionner sa famille de modèles Exaone . Cette traction commerciale confère à la jeune pousse une crédibilité certaine au moment où elle vise le marché mondial des infrastructures hyperscale avec sa plateforme de troisième génération.
Un autre facteur de différenciation clé est la pile logicielle de FuriosaAI. Son kit de développement logiciel (SDK) utilise un compilateur générique qui fait correspondre automatiquement le code PyTorch à son silicium, évitant ainsi d'avoir à écrire à la main des noyaux CUDA optimisés. Son architecture de jeu d'instructions virtuel (Virtual ISA) offre aux développeurs un contrôle de bas niveau sans la complexité de la programmation sur GPU .
La philosophie de conception de FuriosaAI est que les GPU traditionnels sont pénalisés par un « impôt sur l'héritage » de leurs origines graphiques. Selon l'entreprise, l'architecture SIMT des GPU peine à gérer les schémas d'accès mémoire irréguliers, pourtant courants dans les charges de travail d'inférence IA modernes. Son architecture « Tensor Contraction Processor » (TCP) est une page blanche qui privilégie le transfert de données à large bande passante et les opérations massives sur les tenseurs (les structures de données fondamentales de l'IA) plutôt que la gestion des threads, visant une efficacité énergétique et une densité de jetons (tokens) supérieures dans les racks de datacenters à l'alimentation électrique contrainte .
L'accord avec FuriosaAI est le dernier épisode de la vaste stratégie de silicium sur mesure déployée par Broadcom. En octobre 2025, OpenAI a annoncé un partenariat pluriannuel avec Broadcom pour co-développer et déployer une capacité phénoménale de 10 gigawatts d'accélérateurs IA et d'équipements réseau personnalisés, avec un premier déploiement prévu pour le second semestre 2026 utilisant à la fois des conceptions 3 nm et 2 nm . Le portefeuille de clients de Broadcom pour les puces sur mesure comprend également Microsoft, Amazon, Meta et Google, qui investissent tous des milliards pour concevoir des puces spécifiquement adaptées à leurs charges de travail d'IA
.
Cette vague de partenariats reflète un changement structurel du marché. Selon le cabinet d'études TrendForce, les serveurs IA basés sur des ASIC devraient représenter 27,8 % du total des livraisons de serveurs IA en 2026 – un plus haut pluriannuel – et cette part devrait grimper à près de 40 % du marché d'ici 2030 . Le rythme de croissance des puces IA sur mesure est éloquent : les données de TrendForce montrent que les livraisons de puces IA personnalisées par les fournisseurs de cloud devraient croître de 44,6 % en 2026, soit près du triple du taux de croissance de 16,1 % prévu pour les GPU standards du marché
.
Même si Nvidia détient encore environ 70 % du marché des puces IA, sa part devrait s'éroder à mesure que les géants du cloud se tournent vers du silicium sur mesure offrant une meilleure efficacité pour leurs piles logicielles uniques . La plateforme FuriosaAI–Broadcom s'inscrit directement dans cette tendance, en tentant de passer d'une carte d'inférence de 180 W validée par des entreprises clientes à un système à l'échelle du rack, gravé en 2 nm et s'appuyant sur un tissu Ethernet, conçu pour les plus grands centres de données du monde.
Comments
0 comments