AntwortenVeröffentlichtvor 2 MonatenLast edited letzten Monat21 Quellen

FuriosaAI und Broadcom bauen eine Rack-Scale-KI-Plattform auf 2 nm

FuriosaAI und Broadcom entwickeln nicht nur einen Chip, sondern eine komplette Rack Scale Plattform: Der KI Beschleuniger der dritten Generation setzt auf 2 nm Fertigung, „Dual Layer" HBM4/4E Speicher und Broadcoms 3.... Die Plattform ist für riesige Rechenzentren und agentenbasierte KI Workloads konzipiert und inte...

Suchen und Fakten prüfen mit Studio Global AI Mehr Trendseiten ansehen

FuriosaAI and Broadcom third-generation 2nm AI inference chip platform concept — What are the key details of the strategic partnership between FuriosaAI and Broadcom to co-develop a third-generation 2nm AI inference chipA conceptual rendering of the third-generation AI inference chiplet being co-developed by FuriosaAI and Broadcom.
KI-Prompt
Create a landscape editorial hero image for this Studio Global article: What are the key details of the strategic partnership between FuriosaAI and Broadcom to co-develop a third-generation 2nm AI inference chip. Article summary: Here is a comprehensive breakdown of the FuriosaAI–Broadcom partnership, structured around each of your questions.. Topic tags: general, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# FuriosaAI partners with Broadcom on third AI inference platform. FuriosaAI, a builder of high-performance inference silicon, announced a strategic partnership with big chip maker" source context "FuriosaAI partners with Broadcom on third AI inference platform" Reference image 2: visual subject "# FuriosaAI partners with Broadcom on third AI inference platform. FuriosaAI, a builder of high-performance inference
openai.com

In der Hardware, die Künstliche Intelligenz antreibt, zeichnet sich ein bedeutender Wandel ab. Am 27. Mai 2026 gab das südkoreanische KI-Chip-Startup FuriosaAI eine strategische Partnerschaft mit dem Halbleitergiganten Broadcom bekannt, um gemeinsam seinen KI-Beschleuniger der dritten Generation zu entwickeln . Dieser Schritt ist ein deutliches Signal dafür, dass sich die Branche von dem Modell einer Einheits-GPU entfernt und hin zu hochspezialisierter, maßgeschneiderter Infrastruktur bewegt, die speziell für KI-Inferenz in riesigem Maßstab entwickelt wird.

Der neue Chip stellt einen Sprung von einer einzelnen Beschleunigerkarte zu einem kompletten System auf Rack-Ebene dar, das für die nächste Ära der KI entwickelt wird. Er wird auf Basis eines 2-Nanometer-Rechen-Dies mit „Dual-Layer"-HBM4- oder HBM4E-Speicher gebaut, ermöglicht durch Broadcoms fortschrittliche Packaging-Technologie . Das Design nutzt Broadcoms 3.5D XDSiP-Technologie (Extreme Dimension System in Package), um Rechenleistung, Speicher, I/O und Logik in einzelne Chiplets zu zerlegen und diese mithilfe von 3D-Techniken wie Hybrid Bonding zu verbinden . Die ersten Muster für Kunden sind für das erste Halbjahr 2028 geplant .

Mehr als nur ein Chip: Eine Inferenz-Plattform für das ganze Rack

Was diese Partnerschaft von einem Standard-Kooperationsprojekt unterscheidet, ist ihr Umfang. FuriosaAI und Broadcom entwerfen nicht einfach nur einen schnelleren Chip; sie bauen eine integrierte Inferenz-Plattform auf Rack-Ebene, die alle Systemengpässe von hyperskalierenden KI-Rechenzentren auf einmal adressiert .

Zusätzlich zur Verpackungstechnik integriert die Plattform mehrere weitere Technologien von Broadcom :

XPU-Technologie und IP-Plattform: Ein Integrationsframework auf Systemebene, das das Design komplexer Multi-Die-Beschleuniger vereinfacht.
Ethernet Scale-Up und Fabric Switches: Beinhaltet High-Radix-Switches wie den Tomahawk 6 (TH6), mit denen Systeme nahtlos von acht Chips auf Tausende von Knoten in ganzen Racks skaliert werden können.
PCIe-Technologien: Liefern die hochbandbreitigen Verbindungen, die benötigt werden, um riesige Datenmengen zwischen den Komponenten zu bewegen.

Charlie Kawwas, Präsident der Semiconductor Solutions Group von Broadcom, fasst den Fokus auf die Systemleistung so zusammen: „Die Inferenzleistung wird nicht mehr allein durch die reine Rechenleistung definiert... Durch die Kombination von Furiosas TCP-Architektur mit Broadcoms marktführender XPU-Technologie und IP-Plattform, Ethernet-Scale-Up- und Fabric-Switches bauen wir eine Plattform, die die entscheidenden Engpässe von groß angelegter agentenbasierter KI beseitigt“ . Das System wird mit einer "All-to-All"-Topologie gebaut, um die komplexen Kommunikationsmuster von Mixture-of-Experts (MoE)-KI-Modellen zu bewältigen .

FuriosaAIs Positionierung: Von einer PCIe-Karte zum Hyperscale-Konkurrenten

FuriosaAI geht diese Partnerschaft mit einem bereits erprobten kommerziellen Chip an. Der Chip der zweiten Generation, genannt RNGD, wird bereits in Massenproduktion im TSMC 5-nm-Verfahren gefertigt . Der RNGD ist eine PCIe-Karte mit 180 Watt TDP, die 512 TeraFLOPS an FP8-Leistung mit 48 GB HBM3-Speicher und 1,5 TB/s Bandbreite liefert. Das entspricht etwa 1/9 der Spitzenrechenleistung eines Nvidia B200, verbraucht dabei aber nur rund 1/5 des Stroms .

Der RNGD wurde von großen koreanischen Unternehmen validiert, darunter Samsung SDS und LG AI Research, wo LG seine Exaone-Modellfamilie auf der Hardware betreibt . Diese kommerzielle Bewährungsprobe verleiht dem Startup eine solide Basis an Glaubwürdigkeit, während es mit seiner Plattform der dritten Generation den globalen Hyperscale-Markt anvisiert.

Ein entscheidendes Unterscheidungsmerkmal ist FuriosaAIs Software-Stack. Das SDK des Unternehmens verwendet einen allgemeinen Compiler, der PyTorch-Code automatisch direkt auf die Hardware abbildet – die Notwendigkeit von manuell optimierten CUDA-Kernels entfällt damit. Die sogenannte „Virtual ISA" gibt Entwicklern eine Low-Level-Kontrolle ohne die Komplexität der GPU-Programmierung .

FuriosaAIs Design-Philosophie basiert auf der Annahme, dass herkömmliche GPUs eine Art „Altlast" aus ihrer Grafik-Historie mit sich herumschleppen. Ihre SIMT-Architektur (Single Instruction, Multiple Threads), so das Argument des Unternehmens, hat Probleme mit den unregelmäßigen Speicherzugriffsmustern, die bei modernen KI-Inferenz-Workloads üblich sind. Der Tensor Contraction Processor (TCP) ist eine komplett neu entwickelte Architektur, die den Fokus auf hochbandbreitige Datenbewegung und massive Tensor-Operationen legt, anstatt auf Thread-Management. Das Ziel ist eine überlegene Leistung pro Watt und eine höhere „Token-Dichte" in Racks von Rechenzentren mit begrenzter Stromversorgung .

Der größere Kontext: Eine kundenspezifische ASIC-Revolution

Der Deal mit FuriosaAI ist der jüngste Schritt in einer umfassenden Strategie von Broadcom für kundenspezifische Halbleiter. Im Oktober 2025 kündigte OpenAI eine mehrjährige Partnerschaft mit Broadcom an, um gemeinsam eine atemberaubende Kapazität von 10 Gigawatt an maßgeschneiderten KI-Beschleunigern und Netzwerkhardware zu entwickeln und einzusetzen, wobei die erste Bereitstellung für die zweite Hälfte des Jahres 2026 mit 3-nm- und 2-nm-Designs vorgesehen ist . Zu Broadcoms Partnern für kundenspezifische ASICs gehören außerdem Microsoft, Amazon, Meta und Google, die allesamt Milliarden investieren, um speziell für ihre KI-Workloads optimierte Chips zu entwickeln .

Diese Welle an Partnerschaften spiegelt einen strukturellen Wandel im Markt wider. Laut dem Marktforschungsunternehmen TrendForce wird prognostiziert, dass ASIC-basierte KI-Server im Jahr 2026 27,8 % aller KI-Server-Auslieferungen ausmachen werden – ein Mehrjahreshoch. Bis zum Jahr 2030 soll dieser Anteil auf fast 40 % des Marktes anwachsen . Das Wachstumstempo der kundenspezifischen KI-Chips ist dabei besonders bezeichnend: TrendForce-Daten zeigen, dass die Auslieferungen von Custom-KI-Chips von Cloud-Anbietern im Jahr 2026 voraussichtlich um 44,6 % wachsen werden, was fast das Dreifache des für marktübliche GPUs prognostizierten Wachstums von 16,1 % ist .

Obwohl Nvidia weiterhin rund 70 % des KI-Chipmarktes hält, wird erwartet, dass dieser Anteil sinken wird, da die Hyperscaler auf kundenspezifische Chips setzen, die eine bessere Effizienz für ihre individuellen Software-Stacks bieten können . Die FuriosaAI-Broadcom-Plattform ist ein direkter Vorstoß in diesen Trend und versucht, den Sprung von einer validierten 180-Watt-Inferenzkarte zu einem 2-nm-basierten System mit Ethernet-Fabric zu schaffen, das für die größten Rechenzentren der Welt konzipiert ist.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Suchen und Fakten prüfen mit Studio Global AI

Die Leute fragen auch

Wie lautet die kurze Antwort auf „FuriosaAI und Broadcom bauen eine Rack-Scale-KI-Plattform auf 2 nm“?

Was sind die wichtigsten Punkte, die zuerst validiert werden müssen?

Was soll ich als nächstes in der Praxis tun?

Dieser Deal reiht sich in eine Welle von kundenspezifischen ASIC Partnerschaften ein und unterstreicht den Trend weg von Allzweck GPUs: Für 2026 wird prognostiziert, dass ASIC basierte KI Server bereits 27,8 % der ges...

Quellen

← Back to Trending