Câu trả lờiĐã xuất bản2 tháng trướcLast edited tháng trước21 nguồn

FuriosaAI bắt tay Broadcom: Canh bạc hệ thống suy luận 2nm thách thức kỷ nguyên thống trị của GPU

FuriosaAI và Broadcom hợp tác phát triển chip suy luận AI thế hệ thứ ba, không đơn thuần là một con chip mà là nền tảng quy mô tủ rack hoàn chỉnh, tích hợp đóng gói 3.5D, bộ nhớ HBM4/4E và bộ chuyển mạch Ethernet fabric. Nền tảng được thiết kế cho các tác vụ tác nhân AI quy mô siêu lớn, kết hợp kiến trúc Bộ xử lý Co...

Tìm kiếm và kiểm chứng sự thật với Studio Global AI Duyệt thêm trang xu hướng

FuriosaAI and Broadcom third-generation 2nm AI inference chip platform concept — What are the key details of the strategic partnership between FuriosaAI and Broadcom to co-develop a third-generation 2nm AI inference chipA conceptual rendering of the third-generation AI inference chiplet being co-developed by FuriosaAI and Broadcom.
Prompt AI
Create a landscape editorial hero image for this Studio Global article: What are the key details of the strategic partnership between FuriosaAI and Broadcom to co-develop a third-generation 2nm AI inference chip. Article summary: Here is a comprehensive breakdown of the FuriosaAI–Broadcom partnership, structured around each of your questions.. Topic tags: general, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# FuriosaAI partners with Broadcom on third AI inference platform. FuriosaAI, a builder of high-performance inference silicon, announced a strategic partnership with big chip maker" source context "FuriosaAI partners with Broadcom on third AI inference platform" Reference image 2: visual subject "# FuriosaAI partners with Broadcom on third AI inference platform. FuriosaAI, a builder of high-performance inference
openai.com

Một sự chuyển dịch lớn đang diễn ra trong mảng phần cứng hỗ trợ trí tuệ nhân tạo (AI). Ngày 27 tháng 5 năm 2026, startup silicon AI Hàn Quốc FuriosaAI đã công bố quan hệ đối tác chiến lược với gã khổng lồ bán dẫn Broadcom để cùng phát triển bộ tăng tốc AI thế hệ thứ ba của mình . Thỏa thuận này đánh dấu một bước tiến quan trọng trong nỗ lực của toàn ngành nhằm thoát khỏi mô hình GPU "một cỡ vừa tất cả" để chuyển sang cơ sở hạ tầng chuyên biệt, được thiết kế riêng cho tác vụ suy luận AI ở quy mô khổng lồ.

Con chip mới này là một bước nhảy vọt từ một thẻ tăng tốc đơn lẻ lên thành một hệ thống hoàn chỉnh ở cấp độ tủ rack (rack-scale), được thiết kế cho kỷ nguyên AI tiếp theo. Nó sẽ được xây dựng trên một die tính toán 2nm với bộ nhớ HBM4 hoặc HBM4E "lớp kép", tận dụng công nghệ đóng gói tiên tiến của Broadcom . Thiết kế sử dụng công nghệ 3.5D XDSiP (Hệ thống trong gói Kích thước Cực đại) của Broadcom để phân tách các thành phần tính toán, bộ nhớ, I/O và logic thành các chiplet riêng biệt và lắp ráp chúng bằng các kỹ thuật 3D tiên tiến như hybrid bonding . Dự kiến, quá trình lấy mẫu sẽ bắt đầu vào nửa đầu năm 2028 .

Không chỉ là một con chip: Nền tảng Suy luận Quy mô Tủ Rack Toàn diện

Điều làm nên sự khác biệt của mối quan hệ hợp tác này so với một dự án thiết kế ASIC tiêu chuẩn chính là phạm vi của nó. FuriosaAI và Broadcom không chỉ đơn thuần thiết kế một con chip nhanh hơn; họ đang cùng nhau xây dựng một nền tảng suy luận quy mô tủ rack thống nhất, giải quyết các nút thắt cổ chai toàn hệ thống của các trung tâm dữ liệu AI siêu quy mô (hyperscale) .

Ngoài công nghệ đóng gói tiên tiến, nền tảng này còn tích hợp nhiều lớp công nghệ của Broadcom :

Nền tảng IP và Công nghệ XPU: Một khuôn khổ tích hợp cấp hệ thống giúp đơn giản hóa việc thiết kế các bộ tăng tốc đa die phức tạp.
Bộ chuyển mạch Ethernet và Fabric Mở rộng: Bao gồm các bộ chuyển mạch high-radix như Tomahawk 6, cho phép các hệ thống mở rộng liền mạch từ tám chip lên đến hàng nghìn nút trên toàn bộ các tủ rack.
Công nghệ PCIe: Cung cấp các kết nối băng thông cao cần thiết để di chuyển một lượng dữ liệu khổng lồ giữa các thành phần.

Ông Charlie Kawwas, Chủ tịch Bộ phận Giải pháp Bán dẫn của Broadcom, đã định hình mối quan hệ hợp tác này xoay quanh hiệu suất ở cấp độ hệ thống: "Hiệu suất suy luận không còn chỉ được định nghĩa bằng sức mạnh tính toán thô nữa... Bằng cách kết hợp kiến trúc TCP của Furiosa với Nền tảng IP và Công nghệ XPU hàng đầu thị trường của Broadcom, các bộ chuyển mạch Ethernet và fabric mở rộng, chúng tôi đang xây dựng một nền tảng giải quyết các điểm nghẽn chính của AI tác nhân quy mô lớn" . Hệ thống đang được xây dựng với cấu trúc liên kết (topology) có khả năng "tất cả đến tất cả" (all-to-all) để xử lý các mẫu giao tiếp phức tạp mà các mô hình AI Hỗn hợp Chuyên gia (Mixture-of-Experts - MoE) yêu cầu .

Vị thế của FuriosaAI: Từ một thẻ PCIe đến ứng viên sáng giá cho siêu trung tâm dữ liệu

FuriosaAI tham gia vào mối quan hệ hợp tác này với một sản phẩm silicon thương mại đã được chứng minh. Con chip thế hệ thứ hai của họ, có tên là RNGD, hiện đang được sản xuất hàng loạt trên tiến trình 5nm của TSMC . RNGD là một thẻ PCIe TDP 180W, cung cấp 512 teraFLOPS hiệu năng FP8 với 48GB bộ nhớ HBM3 và băng thông 1.5 TB/s. Mặc dù con số này chỉ tương đương khoảng 1/9 sức mạnh tính toán đỉnh của một chiếc Nvidia B200, nhưng nó đạt được điều đó với mức tiêu thụ điện năng chỉ bằng 1/5 .

RNGD đã được xác nhận bởi các doanh nghiệp lớn của Hàn Quốc, bao gồm Samsung SDS và LG AI Research, nơi LG đang vận hành dòng mô hình Exaone của mình trên phần cứng này . Sức hút thương mại này mang lại cho startup một nền tảng uy tín vững chắc khi họ nhắm đến thị trường siêu quy mô toàn cầu với nền tảng thế hệ thứ ba.

Một điểm khác biệt cốt lõi là ngăn xếp phần mềm của FuriosaAI. Bộ SDK của công ty sử dụng một trình biên dịch tổng quát có khả năng tự động ánh xạ mã PyTorch trực tiếp lên silicon của họ, bỏ qua nhu cầu về các nhân (kernels) CUDA được tinh chỉnh thủ công. Kiến trúc Tập lệnh Ảo (Virtual ISA) của họ cung cấp cho các nhà phát triển khả năng kiểm soát cấp thấp mà không cần sự phức tạp của lập trình GPU .

Triết lý thiết kế của FuriosaAI cho rằng các GPU truyền thống phải chịu một "khoản thuế di sản" từ nguồn gốc đồ họa của chúng. Họ lập luận rằng, kiến trúc SIMT của GPU gặp khó khăn với các mẫu truy cập bộ nhớ không đều, vốn thường thấy trong các tác vụ suy luận AI hiện đại. Bộ xử lý Co Tensor (TCP) của họ là một kiến trúc được thiết kế hoàn toàn mới, ưu tiên chuyển động dữ liệu băng thông cao và các phép toán tensor quy mô lớn hơn là quản lý luồng, nhằm đạt được hiệu suất trên mỗi watt và mật độ token vượt trội trong các tủ rack hạn chế về điện năng .

Bối cảnh rộng hơn: Cuộc cách mạng ASIC tùy chỉnh

Thỏa thuận với FuriosaAI là bước mới nhất trong chiến lược silicone tùy chỉnh sâu rộng của Broadcom. Vào tháng 10 năm 2025, OpenAI đã công bố một thỏa thuận hợp tác kéo dài nhiều năm với Broadcom để cùng phát triển và triển khai tới 10 gigawatt bộ tăng tốc AI tùy chỉnh và phần cứng mạng, với đợt triển khai đầu tiên dự kiến vào nửa cuối năm 2026, sử dụng cả thiết kế 3nm và 2nm . Danh sách khách hàng hợp tác phát triển ASIC tùy chỉnh của Broadcom còn bao gồm những tên tuổi lớn như Microsoft, Amazon, Meta và Google, tất cả đều đang đầu tư hàng tỷ đô la để thiết kế các con chip phục vụ mục đích riêng cho các tác vụ AI cụ thể của họ .

Làn sóng hợp tác này phản ánh một sự thay đổi mang tính cấu trúc của thị trường. Theo công ty nghiên cứu TrendForce, các máy chủ AI dựa trên ASIC được dự báo sẽ chiếm 27.8% tổng lượng xuất xưởng máy chủ AI vào năm 2026 — mức cao nhất trong nhiều năm — và được dự báo sẽ tăng lên gần 40% thị trường vào năm 2030 . Tốc độ tăng trưởng của chip AI tùy chỉnh là một minh chứng rõ ràng: dữ liệu của TrendForce cho thấy lượng xuất xưởng chip AI tùy chỉnh từ các nhà cung cấp đám mây đang trên đà tăng trưởng 44.6% vào năm 2026, gần gấp ba lần mức tăng trưởng 16.1% được dự báo cho GPU hàng hóa (merchant GPUs) .

Mặc dù Nvidia hiện vẫn nắm giữ khoảng 70% thị phần chip AI, nhưng thị phần này được dự kiến sẽ giảm xuống khi các công ty siêu quy mô chuyển hướng sang silicone tùy chỉnh, thứ có thể mang lại hiệu quả tốt hơn cho ngăn xếp phần mềm độc đáo của họ . Nền tảng của FuriosaAI-Broadcom là một canh bạc trực tiếp vào xu hướng này, nỗ lực nhảy vọt từ một thẻ suy luận 180W đã được kiểm chứng lên một hệ thống 2nm, dựa trên nền tảng Ethernet fabric, được thiết kế cho các trung tâm dữ liệu lớn nhất thế giới.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Tìm kiếm và kiểm chứng sự thật với Studio Global AI

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "FuriosaAI bắt tay Broadcom: Canh bạc hệ thống suy luận 2nm thách thức kỷ nguyên thống trị của GPU" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Thương vụ đánh dấu làn sóng hợp tác chip ASIC tùy chỉnh ngày càng mở rộng, phản ánh sự dịch chuyển của ngành khỏi GPU đa năng, với dự báo máy chủ dựa trên ASIC sẽ chiếm 27.8% tổng lượng xuất xưởng máy chủ AI vào năm 2...

Nguồn

← Back to Trending