Yang membedakan kemitraan ini dari sekadar kerja sama desain ASIC standar adalah cakupannya. FuriosaAI dan Broadcom tidak hanya merancang chip yang lebih cepat; mereka sedang membangun platform inferensi skala rak terpadu yang mengatasi hambatan sistem secara menyeluruh di pusat data AI hiperskal .
Charlie Kawwas, presiden Broadcom Semiconductor Solutions Group, membingkai kemitraan ini seputar kinerja tingkat sistem: "Kinerja inferensi tidak lagi hanya ditentukan oleh komputasi mentah... Dengan memasangkan arsitektur TCP Furiosa dengan Teknologi XPU dan Platform IP terdepan di pasar milik Broadcom, serta switch fabric dan scale-up Ethernet, kami sedang membangun platform yang mengatasi hambatan utama AI agentik skala besar" . Sistem ini dibangun dengan topologi yang mumpuni untuk konektivitas all-to-all guna menangani pola komunikasi kompleks yang diperlukan oleh model AI Mixture-of-Experts (MoE)
.
FuriosaAI memasuki kemitraan ini dengan silikon komersial yang telah terbukti. Chip generasi keduanya, yang disebut RNGD, sudah dalam produksi massal pada proses 5nm TSMC . RNGD adalah kartu PCIe dengan TDP 180W yang menghasilkan kinerja 512 teraFLOPS FP8 dengan memori HBM3 48GB dan bandwidth 1,5 TB/dtk. Meskipun itu hanya mewakili sekitar 1/9 dari komputasi puncak Nvidia B200, ia melakukannya dengan konsumsi daya sekitar 1/5 lebih rendah
.
RNGD telah divalidasi oleh perusahaan besar Korea, termasuk Samsung SDS dan LG AI Research, di mana LG menjalankan keluarga model Exaone-nya pada perangkat keras ini . Traksi komersial ini memberi startup tersebut landasan kredibilitas saat menargetkan pasar hiperskal global dengan platform generasi ketiganya.
Salah satu pembeda utama adalah tumpukan perangkat lunak (software stack) FuriosaAI. SDK perusahaan menggunakan kompiler umum yang secara otomatis memetakan kode PyTorch langsung ke silikonnya, melewati kebutuhan akan kernel CUDA yang disetel secara manual. Virtual ISA-nya memberi pengembang kendali tingkat rendah tanpa kerumitan pemrograman GPU .
Filosofi desain FuriosaAI adalah bahwa GPU tradisional membawa "pajak warisan" dari asal-usul grafisnya. Arsitektur SIMT mereka, menurut perusahaan, kesulitan dengan pola akses memori yang tidak teratur yang umum dalam beban kerja inferensi AI modern. Tensor Contraction Processor (TCP) miliknya adalah arsitektur yang dirancang dari nol yang memprioritaskan pergerakan data bandwidth tinggi dan operasi tensor besar-besaran di atas manajemen thread, yang bertujuan untuk kinerja per watt dan kepadatan token yang unggul di rak pusat data yang dibatasi daya .
Kesepakatan FuriosaAI adalah yang terbaru dalam strategi silikon kustom ekstensif Broadcom. Pada Oktober 2025, OpenAI mengumumkan kemitraan multi-tahun dengan Broadcom untuk mengembangkan bersama dan menyebarkan kapasitas 10 gigawatt akselerator AI kustom dan perangkat keras jaringan yang mengejutkan, dengan penyebaran pertama ditargetkan pada paruh kedua 2026 menggunakan desain 3nm dan 2nm . Jajaran mitra ASIC kustom Broadcom juga mencakup Microsoft, Amazon, Meta, dan Google, semuanya berinvestasi miliaran dolar untuk merancang chip yang dibuat khusus untuk beban kerja AI spesifik mereka
.
Gelombang kemitraan ini mencerminkan pergeseran struktural di pasar. Menurut perusahaan riset TrendForce, server AI berbasis ASIC diproyeksikan mencapai 27,8% dari total pengiriman server AI pada tahun 2026, level tertinggi dalam beberapa tahun, dan diperkirakan akan tumbuh menjadi hampir 40% dari pasar pada tahun 2030 . Tingkat pertumbuhan chip AI kustom sangat signifikan: Data TrendForce menunjukkan pengiriman chip AI kustom dari penyedia cloud berada di jalur untuk tumbuh 44,6% pada tahun 2026, hampir tiga kali lipat dari tingkat pertumbuhan 16,1% yang diproyeksikan untuk GPU komersial
.
Sementara Nvidia masih menguasai sekitar 70% pasar chip AI, pangsa pasarnya diperkirakan akan menurun karena perusahaan hiperskal beralih ke silikon kustom yang dapat memberikan efisiensi lebih baik untuk tumpukan perangkat lunak unik mereka . Platform FuriosaAI–Broadcom adalah permainan langsung ke dalam tren ini, berupaya melompat dari kartu inferensi 180W yang telah divalidasi ke sistem 2nm berbasis fabric Ethernet yang dirancang untuk pusat data terbesar di dunia.
Comments
0 comments