Khi chạy mô hình 'quái vật' DeepSeek V4 Pro (một mô hình kết hợp chuyên gia - MoE cỡ lớn, đại diện cho phân khúc AI tác tử tiên tiến nhất), GB300 NVL72 đã thể hiện sức mạnh gần như tuyệt đối .
Điểm đáng kinh ngạc nhất nằm ở hiệu quả năng lượng:
Con số 61.340 không chỉ là một kỷ lục. Nó thể hiện khả năng vận hành một 'đội quân' AI lập trình viên ở quy mô cực lớn với chi phí năng lượng thấp hơn rất nhiều.
Kết quả từ AgentPerf chỉ là một mảnh ghép mới nhất trong chiến lược tổng thể của NVIDIA nhằm biến Blackwell Ultra thành nền tảng không thể thay thế cho AI tác tử:
1. Sức mạnh tổng hợp từ phần cứng đến phần mềm
NVIDIA không giấu giếm bí quyết: sự cải tiến vượt bậc đến từ thiết kế cộng hưởng ở mọi tầng. Công nghệ NVLink kết nối 72 GPU thành một khối thống nhất, các lõi CUDA được tối ưu để tính toán và giao tiếp song song cho mô hình MoE, cùng với bộ công cụ TensorRT LLM (bao gồm WideEP/DeepEP, DeepGEMM) giúp duy trì hiệu suất cao ngay cả khi số lượng tác tử đồng thời tăng vọt .
2. 'Thâu tóm' mọi bảng xếp hạng
Trước khi chinh phục AgentPerf, Blackwell Ultra đã 'càn quét' các bài kiểm tra danh giá khác:
3. Sẵn sàng cho 'trận chiến' thực địa
NVIDIA nhấn mạnh rằng đây không chỉ là điểm số phòng thí nghiệm. Các đối tác như Together AI (đơn vị cung cấp sức mạnh cho công cụ lập trình AI Cursor) và DeepInfra (hỗ trợ Pam.ai) đã và đang vận hành khối lượng công việc tác tử thực tế trên nền tảng Blackwell . Điều này cho thấy hệ sinh thái đã sẵn sàng cho việc triển khai thương mại quy mô lớn.
4. Con đường phía trước
Dù Blackwell Ultra đang là 'đỉnh cao', NVIDIA đã úp mở về thế hệ tiếp theo: kiến trúc Vera Rubin, hiện đang trong giai đoạn sản xuất, hứa hẹn một cú nhảy vọt khác về năng lực AI tác tử . Những cải tiến như 50 PFLOPs sức mạnh tính toán NVFP4 và khả năng tăng tốc lệnh gọi công cụ đang được hé lộ cho tương lai
.
Comments
0 comments