Điều làm nên sự khác biệt của mối quan hệ hợp tác này so với một dự án thiết kế ASIC tiêu chuẩn chính là phạm vi của nó. FuriosaAI và Broadcom không chỉ đơn thuần thiết kế một con chip nhanh hơn; họ đang cùng nhau xây dựng một nền tảng suy luận quy mô tủ rack thống nhất, giải quyết các nút thắt cổ chai toàn hệ thống của các trung tâm dữ liệu AI siêu quy mô (hyperscale) .
Ông Charlie Kawwas, Chủ tịch Bộ phận Giải pháp Bán dẫn của Broadcom, đã định hình mối quan hệ hợp tác này xoay quanh hiệu suất ở cấp độ hệ thống: "Hiệu suất suy luận không còn chỉ được định nghĩa bằng sức mạnh tính toán thô nữa... Bằng cách kết hợp kiến trúc TCP của Furiosa với Nền tảng IP và Công nghệ XPU hàng đầu thị trường của Broadcom, các bộ chuyển mạch Ethernet và fabric mở rộng, chúng tôi đang xây dựng một nền tảng giải quyết các điểm nghẽn chính của AI tác nhân quy mô lớn" . Hệ thống đang được xây dựng với cấu trúc liên kết (topology) có khả năng "tất cả đến tất cả" (all-to-all) để xử lý các mẫu giao tiếp phức tạp mà các mô hình AI Hỗn hợp Chuyên gia (Mixture-of-Experts - MoE) yêu cầu
.
FuriosaAI tham gia vào mối quan hệ hợp tác này với một sản phẩm silicon thương mại đã được chứng minh. Con chip thế hệ thứ hai của họ, có tên là RNGD, hiện đang được sản xuất hàng loạt trên tiến trình 5nm của TSMC . RNGD là một thẻ PCIe TDP 180W, cung cấp 512 teraFLOPS hiệu năng FP8 với 48GB bộ nhớ HBM3 và băng thông 1.5 TB/s. Mặc dù con số này chỉ tương đương khoảng 1/9 sức mạnh tính toán đỉnh của một chiếc Nvidia B200, nhưng nó đạt được điều đó với mức tiêu thụ điện năng chỉ bằng 1/5
.
RNGD đã được xác nhận bởi các doanh nghiệp lớn của Hàn Quốc, bao gồm Samsung SDS và LG AI Research, nơi LG đang vận hành dòng mô hình Exaone của mình trên phần cứng này . Sức hút thương mại này mang lại cho startup một nền tảng uy tín vững chắc khi họ nhắm đến thị trường siêu quy mô toàn cầu với nền tảng thế hệ thứ ba.
Một điểm khác biệt cốt lõi là ngăn xếp phần mềm của FuriosaAI. Bộ SDK của công ty sử dụng một trình biên dịch tổng quát có khả năng tự động ánh xạ mã PyTorch trực tiếp lên silicon của họ, bỏ qua nhu cầu về các nhân (kernels) CUDA được tinh chỉnh thủ công. Kiến trúc Tập lệnh Ảo (Virtual ISA) của họ cung cấp cho các nhà phát triển khả năng kiểm soát cấp thấp mà không cần sự phức tạp của lập trình GPU .
Triết lý thiết kế của FuriosaAI cho rằng các GPU truyền thống phải chịu một "khoản thuế di sản" từ nguồn gốc đồ họa của chúng. Họ lập luận rằng, kiến trúc SIMT của GPU gặp khó khăn với các mẫu truy cập bộ nhớ không đều, vốn thường thấy trong các tác vụ suy luận AI hiện đại. Bộ xử lý Co Tensor (TCP) của họ là một kiến trúc được thiết kế hoàn toàn mới, ưu tiên chuyển động dữ liệu băng thông cao và các phép toán tensor quy mô lớn hơn là quản lý luồng, nhằm đạt được hiệu suất trên mỗi watt và mật độ token vượt trội trong các tủ rack hạn chế về điện năng .
Thỏa thuận với FuriosaAI là bước mới nhất trong chiến lược silicone tùy chỉnh sâu rộng của Broadcom. Vào tháng 10 năm 2025, OpenAI đã công bố một thỏa thuận hợp tác kéo dài nhiều năm với Broadcom để cùng phát triển và triển khai tới 10 gigawatt bộ tăng tốc AI tùy chỉnh và phần cứng mạng, với đợt triển khai đầu tiên dự kiến vào nửa cuối năm 2026, sử dụng cả thiết kế 3nm và 2nm . Danh sách khách hàng hợp tác phát triển ASIC tùy chỉnh của Broadcom còn bao gồm những tên tuổi lớn như Microsoft, Amazon, Meta và Google, tất cả đều đang đầu tư hàng tỷ đô la để thiết kế các con chip phục vụ mục đích riêng cho các tác vụ AI cụ thể của họ
.
Làn sóng hợp tác này phản ánh một sự thay đổi mang tính cấu trúc của thị trường. Theo công ty nghiên cứu TrendForce, các máy chủ AI dựa trên ASIC được dự báo sẽ chiếm 27.8% tổng lượng xuất xưởng máy chủ AI vào năm 2026 — mức cao nhất trong nhiều năm — và được dự báo sẽ tăng lên gần 40% thị trường vào năm 2030 . Tốc độ tăng trưởng của chip AI tùy chỉnh là một minh chứng rõ ràng: dữ liệu của TrendForce cho thấy lượng xuất xưởng chip AI tùy chỉnh từ các nhà cung cấp đám mây đang trên đà tăng trưởng 44.6% vào năm 2026, gần gấp ba lần mức tăng trưởng 16.1% được dự báo cho GPU hàng hóa (merchant GPUs)
.
Mặc dù Nvidia hiện vẫn nắm giữ khoảng 70% thị phần chip AI, nhưng thị phần này được dự kiến sẽ giảm xuống khi các công ty siêu quy mô chuyển hướng sang silicone tùy chỉnh, thứ có thể mang lại hiệu quả tốt hơn cho ngăn xếp phần mềm độc đáo của họ . Nền tảng của FuriosaAI-Broadcom là một canh bạc trực tiếp vào xu hướng này, nỗ lực nhảy vọt từ một thẻ suy luận 180W đã được kiểm chứng lên một hệ thống 2nm, dựa trên nền tảng Ethernet fabric, được thiết kế cho các trung tâm dữ liệu lớn nhất thế giới.
Comments
0 comments