Cốt lõi của Vera Rubin là GPU R200, một con chip kép "khủng" được sản xuất trên tiến trình 3nm N3P của TSMC, chứa khoảng 336 tỷ bóng bán dẫn – mật độ gấp 1.6 lần so với thế hệ Blackwell B200 trước đó . Bạn có thể hình dung sức mạnh này qua con số: mỗi GPU chỉ bằng một tấm bưu thiếp nhưng chứa sức mạnh tính toán tương đương hàng nghìn chiếc máy tính xách tay cao cấp nhất hiện nay.
Nvidia thiết kế GPU này cho kỷ nguyên của AI tác tử (agentic AI), trang bị Công cụ Biến đổi (Transformer Engine) mới và hỗ trợ định dạng số thực 4-bit NVFP4 để tăng tốc độ xử lý suy luận một cách đột phá . Mỗi GPU R200 được ghép nối với 288 GB bộ nhớ HBM4, đạt băng thông lên đến 22 TB/s
. Tuy vậy, chính trang sản phẩm của Nvidia cũng thận trọng lưu ý rằng băng thông thực tế trong những lô hàng đầu tiên có thể thấp hơn mục tiêu 22 TB/s, do các nhà cung cấp bộ nhớ như SK Hynix và Samsung đang gặp khó khăn trong việc đáp ứng yêu cầu kỹ thuật khắt khe
.
Về hiệu năng thuần túy, mỗi GPU đạt 50 PFLOPS suy luận NVFP4 và 35 PFLOPS huấn luyện, tương ứng gấp 5 lần và 3.5 lần so với thế hệ Blackwell . Với các tác vụ huấn luyện FP8/FP6, mỗi GPU cung cấp 17.5 PFLOPS
. Băng thông kết nối GPU với GPU cũng có bước nhảy vọt thế hệ khi NVLink 6 đạt 3.6 TB/s, gấp đôi so với NVLink 5 trên hệ thống GB200 tiền nhiệm
.
Vera Rubin NVL72 là siêu máy tính AI ở quy mô tủ rack thế hệ thứ ba của Nvidia. Một tủ rack duy nhất chứa 72 GPU Rubin và 36 CPU Vera, được ghép thành 36 cặp siêu chip Vera Rubin (mỗi cặp gồm 2 GPU và 1 CPU) . CPU Vera được thiết kế riêng trên kiến trúc Armv9.2, sở hữu 88 nhân "Olympus", cung cấp băng thông bộ nhớ gấp 2.4 lần và dung lượng bộ nhớ gấp 3 lần so với CPU Grace trước đây
.
Các thông số kỹ thuật chính của hệ thống NVL72:
Nvidia đã chính thức công bố nền tảng Vera Rubin tại hội nghị GTC 2026 vào tháng 3, và việc gửi mẫu thử nghiệm cho khách hàng đã được tiến hành . Dự kiến, ông Huang sẽ dùng bài phát biểu tại Đài Bắc lần này để cập nhật lịch trình sản xuất chi tiết và các cam kết về số lượng. Lộ trình công khai hiện tại cho thấy quá trình tăng cường sản xuất sẽ diễn ra vào nửa cuối năm 2026, và các hệ thống DGX Vera Rubin NVL72 đầu tiên sẽ được xuất xưởng trong khoảng thời gian đó
. Nvidia cũng đã hé lộ về kiến trúc thế hệ tiếp theo mang tên "Feynman", nhưng thông tin chi tiết vẫn còn rất hạn chế
.
Có lẽ bất ngờ lớn nhất với người dùng phổ thông sẽ là N1X, một con chip hệ thống trên một vi mạch (SoC) dựa trên kiến trúc ARM, được hợp tác phát triển cùng MediaTek, nhắm thẳng vào thị trường laptop Windows. Đây là bước tiến mạnh mẽ nhất của Nvidia vào thị trường PC tiêu dùng trong nhiều năm. Nvidia, Microsoft và Arm đều đã đồng loạt "nhá hàng" trước thềm sự kiện .
N1X sử dụng CPU 20 nhân kết hợp, chia đều giữa 10 nhân hiệu năng cao Cortex-X925 và 10 nhân tiết kiệm điện Cortex-A725, tất cả đều dựa trên kiến trúc Armv9.2 . Một kết quả rò rỉ từ Geekbench cho thấy xung nhịp cơ bản là 2.81 GHz, mặc dù xung nhịp tối đa (boost clock) được kỳ vọng sẽ cao hơn đáng kể
.
Điểm nhấn thực sự nằm ở GPU tích hợp (iGPU). Nó sở hữu 6.144 lõi CUDA trên kiến trúc Blackwell – ngang bằng số lõi thô của một card đồ họa rời GeForce RTX 5070 cho máy tính để bàn . Điều này có nghĩa là bạn có thể xem đây như việc nhồi nhét sức mạnh của một card đồ họa chơi game tầm trung-cao vào bên trong một con chip duy nhất. Các ước tính ban đầu từ các nguồn tin trong chuỗi cung ứng cho thấy sức mạnh của iGPU này có thể nằm giữa một chiếc RTX 4070 và RTX 5070 phiên bản desktop, đủ để chơi mượt mà hầu hết các tựa game AAA ở thiết lập cao
.
N1X sử dụng kiến trúc bộ nhớ hợp nhất (unified memory), cho phép CPU và GPU chia sẻ chung một "kho" bộ nhớ duy nhất. Con chip này hỗ trợ tối đa 128 GB LPDDR5X, một con số cực kỳ hào phóng cho phân khúc laptop .
Nó được sản xuất trên tiến trình 3nm (N3) của TSMC, sử dụng thiết kế đóng gói đa chip 2.5D: một chiplet CPU do MediaTek thiết kế và một chiplet GPU do Nvidia thiết kế, kết nối với nhau qua cầu nối NVLink C2C hai chiều với băng thông 300 GB/s .
Nvidia chưa chính thức công bố TDP (công suất thoát nhiệt), nhưng N1X được thiết kế cho các dòng laptop chơi game có quạt tản nhiệt chủ động. Các báo cáo trong ngành ước tính mức tiêu thụ điện của SoC này vào khoảng 25–45W, tùy thuộc vào thiết kế tản nhiệt của từng mẫu máy .
N1X được kỳ vọng sẽ ra mắt lần đầu trên các mẫu laptop chơi game từ Dell Alienware và Lenovo Legion trong nửa đầu năm 2026 . Người dùng phổ thông có thể sẽ không phải chờ đợi quá lâu để trải nghiệm sức mạnh này trên các cỗ máy thương mại. Một phiên bản thấp hơn là N1 với ít lõi hơn cũng đang được lên kế hoạch
. Nvidia cũng đã vạch ra lộ trình cho dòng chip thế hệ tiếp theo, dự kiến ra mắt vào năm 2027 với tên gọi N2
.
Thông tin chi tiết về kế hoạch cụ thể của AMD, Intel, và Qualcomm tại Computex 2026 vẫn chưa có nhiều nguồn tin đáng tin cậy tại thời điểm này. Trong lịch sử, cả ba công ty đều sử dụng Computex như một sân khấu chính để công bố các sản phẩm lớn và đưa ra những bài phát biểu quan trọng. Độc giả quan tâm nên trực tiếp tìm kiếm những thông tin mới nhất về các thông báo của họ trong năm nay.
Comments
0 comments