Was diese Partnerschaft von einem Standard-Kooperationsprojekt unterscheidet, ist ihr Umfang. FuriosaAI und Broadcom entwerfen nicht einfach nur einen schnelleren Chip; sie bauen eine integrierte Inferenz-Plattform auf Rack-Ebene, die alle Systemengpässe von hyperskalierenden KI-Rechenzentren auf einmal adressiert .
Zusätzlich zur Verpackungstechnik integriert die Plattform mehrere weitere Technologien von Broadcom :
Charlie Kawwas, Präsident der Semiconductor Solutions Group von Broadcom, fasst den Fokus auf die Systemleistung so zusammen: „Die Inferenzleistung wird nicht mehr allein durch die reine Rechenleistung definiert... Durch die Kombination von Furiosas TCP-Architektur mit Broadcoms marktführender XPU-Technologie und IP-Plattform, Ethernet-Scale-Up- und Fabric-Switches bauen wir eine Plattform, die die entscheidenden Engpässe von groß angelegter agentenbasierter KI beseitigt“ . Das System wird mit einer "All-to-All"-Topologie gebaut, um die komplexen Kommunikationsmuster von Mixture-of-Experts (MoE)-KI-Modellen zu bewältigen
.
FuriosaAI geht diese Partnerschaft mit einem bereits erprobten kommerziellen Chip an. Der Chip der zweiten Generation, genannt RNGD, wird bereits in Massenproduktion im TSMC 5-nm-Verfahren gefertigt . Der RNGD ist eine PCIe-Karte mit 180 Watt TDP, die 512 TeraFLOPS an FP8-Leistung mit 48 GB HBM3-Speicher und 1,5 TB/s Bandbreite liefert. Das entspricht etwa 1/9 der Spitzenrechenleistung eines Nvidia B200, verbraucht dabei aber nur rund 1/5 des Stroms
.
Der RNGD wurde von großen koreanischen Unternehmen validiert, darunter Samsung SDS und LG AI Research, wo LG seine Exaone-Modellfamilie auf der Hardware betreibt . Diese kommerzielle Bewährungsprobe verleiht dem Startup eine solide Basis an Glaubwürdigkeit, während es mit seiner Plattform der dritten Generation den globalen Hyperscale-Markt anvisiert.
Ein entscheidendes Unterscheidungsmerkmal ist FuriosaAIs Software-Stack. Das SDK des Unternehmens verwendet einen allgemeinen Compiler, der PyTorch-Code automatisch direkt auf die Hardware abbildet – die Notwendigkeit von manuell optimierten CUDA-Kernels entfällt damit. Die sogenannte „Virtual ISA" gibt Entwicklern eine Low-Level-Kontrolle ohne die Komplexität der GPU-Programmierung .
FuriosaAIs Design-Philosophie basiert auf der Annahme, dass herkömmliche GPUs eine Art „Altlast" aus ihrer Grafik-Historie mit sich herumschleppen. Ihre SIMT-Architektur (Single Instruction, Multiple Threads), so das Argument des Unternehmens, hat Probleme mit den unregelmäßigen Speicherzugriffsmustern, die bei modernen KI-Inferenz-Workloads üblich sind. Der Tensor Contraction Processor (TCP) ist eine komplett neu entwickelte Architektur, die den Fokus auf hochbandbreitige Datenbewegung und massive Tensor-Operationen legt, anstatt auf Thread-Management. Das Ziel ist eine überlegene Leistung pro Watt und eine höhere „Token-Dichte" in Racks von Rechenzentren mit begrenzter Stromversorgung .
Der Deal mit FuriosaAI ist der jüngste Schritt in einer umfassenden Strategie von Broadcom für kundenspezifische Halbleiter. Im Oktober 2025 kündigte OpenAI eine mehrjährige Partnerschaft mit Broadcom an, um gemeinsam eine atemberaubende Kapazität von 10 Gigawatt an maßgeschneiderten KI-Beschleunigern und Netzwerkhardware zu entwickeln und einzusetzen, wobei die erste Bereitstellung für die zweite Hälfte des Jahres 2026 mit 3-nm- und 2-nm-Designs vorgesehen ist . Zu Broadcoms Partnern für kundenspezifische ASICs gehören außerdem Microsoft, Amazon, Meta und Google, die allesamt Milliarden investieren, um speziell für ihre KI-Workloads optimierte Chips zu entwickeln
.
Diese Welle an Partnerschaften spiegelt einen strukturellen Wandel im Markt wider. Laut dem Marktforschungsunternehmen TrendForce wird prognostiziert, dass ASIC-basierte KI-Server im Jahr 2026 27,8 % aller KI-Server-Auslieferungen ausmachen werden – ein Mehrjahreshoch. Bis zum Jahr 2030 soll dieser Anteil auf fast 40 % des Marktes anwachsen . Das Wachstumstempo der kundenspezifischen KI-Chips ist dabei besonders bezeichnend: TrendForce-Daten zeigen, dass die Auslieferungen von Custom-KI-Chips von Cloud-Anbietern im Jahr 2026 voraussichtlich um 44,6 % wachsen werden, was fast das Dreifache des für marktübliche GPUs prognostizierten Wachstums von 16,1 % ist
.
Obwohl Nvidia weiterhin rund 70 % des KI-Chipmarktes hält, wird erwartet, dass dieser Anteil sinken wird, da die Hyperscaler auf kundenspezifische Chips setzen, die eine bessere Effizienz für ihre individuellen Software-Stacks bieten können . Die FuriosaAI-Broadcom-Plattform ist ein direkter Vorstoß in diesen Trend und versucht, den Sprung von einer validierten 180-Watt-Inferenzkarte zu einem 2-nm-basierten System mit Ethernet-Fabric zu schaffen, das für die größten Rechenzentren der Welt konzipiert ist.
Comments
0 comments