Câu trả lờiĐã xuất bản2 tuần trướcLast edited 2 tuần trước20 nguồn

NVIDIA 'càn quét' MLPerf Training v6.0: Lập kỷ lục mới với Blackwell Ultra và DeepSeek-V3

NVIDIA giành chiến thắng tuyệt đối tại MLPerf Training v6.0, dẫn đầu tất cả 7 bài kiểm tra về cả tốc độ huấn luyện quy mô lớn lẫn hiệu năng trên mỗi GPU [3]. MLCommons giới thiệu hai bài kiểm tra mới dành cho kiến trúc Hỗn hợp Chuyên gia (MoE) đầy thách thức là DeepSeek V3 671B và GPT OSS 20B [3][10].

Tìm kiếm và kiểm chứng sự thật với Studio Global AI Duyệt thêm trang xu hướng

509K0

NVIDIA Blackwell Ultra GPUs powering record-breaking MLPerf Training v6.0 results for massive AI models. — What are the key highlights from the MLPerf Training v6.0 results, including Nvidia's performance across all benchmarks on its Blackwell plaNVIDIA's Blackwell platform set new performance records across all MLPerf Training v6.0 benchmarks, driven by the powerful GB300 NVL72 system.
Prompt AI
Create a landscape editorial hero image for this Studio Global article: What are the key highlights from the MLPerf Training v6.0 results, including Nvidia's performance across all benchmarks on its Blackwell pla. Article summary: ## MLPerf Training v6.0 Key Highlights. Topic tags: general, documentation, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Home » News » NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform. # NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform. NVIDIA has publish" source context "NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform - StorageReview.com" Reference image 2: visual subject "# MLPerf Inference v6.0 Results Explained: GPU Performance Rankings for AI Workloads (2026). MLPerf Inference v6.0 results dropped April 1, 2026, and
openai.com

NVIDIA 'Càn Quét' MLPerf Training v6.0: Kỷ Lục Mới Được Thiết Lập

Kỳ đánh giá MLPerf Training v6.0 vừa khép lại với một kết quả không thể thuyết phục hơn: NVIDIA đã giành chiến thắng tuyệt đối trên mọi bài kiểm tra. Họ không chỉ đạt thời gian huấn luyện nhanh nhất ở quy mô lớn mà còn dẫn đầu về hiệu năng trên từng bộ tăng tốc đơn lẻ ở tất cả bảy tác vụ, trở thành bên duy nhất tham gia đầy đủ các hạng mục .

'Bài Toán Khó' Mới: Kiến Trúc MoE và DeepSeek-V3

Điểm nhấn đáng chú ý của mùa giải lần này là sự xuất hiện của các bài kiểm tra Hỗn hợp Chuyên gia (MoE), một kiến trúc đang thịnh hành nhờ khả năng xử lý hiệu quả với chi phí tính toán thấp hơn. Hai cái tên được đưa vào danh sách bao gồm:

DeepSeek-V3: "Gã khổng lồ" với 671 tỷ tham số, nhưng chỉ kích hoạt 37 tỷ tham số cho mỗi token nhờ kiến trúc MoE tiên tiến.
GPT-OSS-20B: Mô hình nhỏ hơn, cũng dựa trên kiến trúc MoE .

NVIDIA là nền tảng duy nhất gửi kết quả cho cả hai bài kiểm tra mới này, tận dụng sức mạnh của hệ thống GB300 NVL72 kết hợp với các tối ưu hóa phần mềm tùy chỉnh như biểu đồ CUDA và định tuyến MoE tiên tiến . Về mặt kỹ thuật, DeepSeek-V3 sử dụng hàng loạt cải tiến "đỉnh cao" như Cơ chế Chú ý Tiềm ẩn Đa Đầu (MLA), phân đoạn chuyên gia chi tiết (160 chuyên gia được định tuyến), dự đoán đa token và cân bằng tải không cần hàm mất mát phụ — những yếu tố giúp tối ưu hóa hiệu quả huấn luyện một cách ngoạn mục .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Tìm kiếm và kiểm chứng sự thật với Studio Global AI

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "NVIDIA 'càn quét' MLPerf Training v6.0: Lập kỷ lục mới với Blackwell Ultra và DeepSeek-V3" là gì?

NVIDIA giành chiến thắng tuyệt đối tại MLPerf Training v6.0, dẫn đầu tất cả 7 bài kiểm tra về cả tốc độ huấn luyện quy mô lớn lẫn hiệu năng trên mỗi GPU [3].

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

CoreWeave lập kỷ lục thế giới khi huấn luyện mô hình DeepSeek V3 671B chỉ trong 2,02 phút trên cụm 8.192 GPU NVIDIA GB300 NVL72 [8][26].

Nguồn

Comments

0 comments

Loading comments...

← Back to Trending

Câu trả lờiĐã xuất bản2 tuần trướcLast edited 2 tuần trước20 nguồn

NVIDIA 'càn quét' MLPerf Training v6.0: Lập kỷ lục mới với Blackwell Ultra và DeepSeek-V3

Tìm kiếm và kiểm chứng sự thật với Studio Global AI Duyệt thêm trang xu hướng

509K0

NVIDIA 'Càn Quét' MLPerf Training v6.0: Kỷ Lục Mới Được Thiết Lập

'Bài Toán Khó' Mới: Kiến Trúc MoE và DeepSeek-V3

DeepSeek-V3: "Gã khổng lồ" với 671 tỷ tham số, nhưng chỉ kích hoạt 37 tỷ tham số cho mỗi token nhờ kiến trúc MoE tiên tiến.
GPT-OSS-20B: Mô hình nhỏ hơn, cũng dựa trên kiến trúc MoE .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Tìm kiếm và kiểm chứng sự thật với Studio Global AI

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "NVIDIA 'càn quét' MLPerf Training v6.0: Lập kỷ lục mới với Blackwell Ultra và DeepSeek-V3" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

CoreWeave lập kỷ lục thế giới khi huấn luyện mô hình DeepSeek V3 671B chỉ trong 2,02 phút trên cụm 8.192 GPU NVIDIA GB300 NVL72 [8][26].

Nguồn

Comments

0 comments

Loading comments...

NVIDIA 'càn quét' MLPerf Training v6.0: Lập kỷ lục mới với Blackwell Ultra và DeepSeek-V3

NVIDIA 'Càn Quét' MLPerf Training v6.0: Kỷ Lục Mới Được Thiết Lập

'Bài Toán Khó' Mới: Kiến Trúc MoE và DeepSeek-V3

Search, cite, and publish your own answer

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "NVIDIA 'càn quét' MLPerf Training v6.0: Lập kỷ lục mới với Blackwell Ultra và DeepSeek-V3" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Nguồn

Comments

NVIDIA 'càn quét' MLPerf Training v6.0: Lập kỷ lục mới với Blackwell Ultra và DeepSeek-V3

NVIDIA 'Càn Quét' MLPerf Training v6.0: Kỷ Lục Mới Được Thiết Lập

'Bài Toán Khó' Mới: Kiến Trúc MoE và DeepSeek-V3

Search, cite, and publish your own answer

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "NVIDIA 'càn quét' MLPerf Training v6.0: Lập kỷ lục mới với Blackwell Ultra và DeepSeek-V3" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Nguồn

Comments

CoreWeave Lập Kỷ Lục 'Chớp Nhoáng' với DeepSeek-V3

Cuộc Đua Nội Bộ: GB300 NVL72 Mạnh Hơn Người Tiền Nhiệm Ra Sao?

Sự Tham Gia Kỷ Lục và Những Tín Hiệu Lạc Quan từ AMD

Hạ Tầng Mạng và Sức Mạnh Tổng Thể