Ở cấp độ tủ rack, cấu hình chủ lực mang lại hiệu suất đáng kinh ngạc. Tủ rack NVIDIA Vera Rubin NVL72, hợp nhất 72 GPU Rubin với 36 CPU Vera, hoạt động như một máy gia tốc quy mô rack đơn nhất và đạt 3.6 Exaflops suy luận NVFP4 cùng 1.6 PB/s băng thông HBM4 . Hiệu suất này cho phép hệ thống hướng tới mục tiêu thông lượng gấp tới 10 lần trên mỗi watt và chi phí token chỉ bằng một phần mười so với các phiên bản tiền nhiệm dựa trên kiến trúc Blackwell
.
Bản thiết kế của Supermicro hỗ trợ hai cấu hình máy chủ chính, mang lại sự linh hoạt cho các nhu cầu hạ tầng khác nhau :
Quản lý sản lượng nhiệt khổng lồ từ một tủ rack băng thông 1.6 PB/s là một thách thức thiết kế sống còn, và Bản thiết kế DCBBS giải quyết nó bằng một ngăn xếp Tản nhiệt Lỏng Trực tiếp DLC-2 tích hợp. Đây không phải là một tiện ích bổ sung tùy chọn mà là một thành phần cốt lõi, được thiết kế sẵn để thu giữ gần như toàn bộ nhiệt và đạt hiệu suất năng lượng tối ưu .
Bản thiết kế này cũng giải quyết vấn đề cung cấp điện và khả năng phục hồi của hệ thống, hai khía cạnh không thể thương lượng của hạ tầng AI siêu quy mô. Các giải pháp tích hợp Kệ Nguồn 33 kW trực tiếp vào các thiết kế tủ rack . Để bảo vệ chống lại sự cố gián đoạn nguồn điện và ngăn ngừa mất mát dữ liệu tính toán đang dang dở, bản thiết kế trang bị Đơn vị Pin Dự phòng (BBU) cung cấp 90 giây nguồn điện 48V DC. Khoảng thời gian này cho phép hệ thống thực hiện một điểm kiểm tra trạng thái (state checkpoint), lưu lại công việc trước khi tắt máy một cách an toàn
. Toàn bộ hạ tầng phía cơ sở vật chất được thiết kế từ đầu cho môi trường một người thuê hoặc nhiều người thuê và mở rộng trên một dải công suất lớn từ 5 MW đến 1 GW
.
Có thể nói, điểm khác biệt quan trọng nhất là mô hình dịch vụ và phần mềm đi kèm của Supermicro, biến sản phẩm từ việc bán phần cứng đơn thuần thành một dịch vụ triển khai 'chìa khóa trao tay'. Bản thiết kế DCBBS bao gồm một đội ngũ chuyên gia tận tâm của Supermicro quản lý toàn bộ vòng đời dự án . Điều này bao gồm:
Nền tảng cho lớp dịch vụ này là bộ phần mềm SuperCloud, cung cấp khả năng kiểm soát hợp nhất cho toàn bộ hạ tầng. Nó xử lý tự động hóa triển khai, cung cấp các công cụ cho nhà phát triển và cho phép quản lý đám mây GPU đa người thuê cho các nhà cung cấp dịch vụ . Quá trình tương tác với khách hàng cho Bản thiết kế DCBBS đã bắt đầu, với các đợt triển khai thực tế được lên kế hoạch đồng bộ với sự ra mắt của nền tảng NVIDIA Vera Rubin vào nửa cuối năm 2026
.
Comments
0 comments