Nemotron 3 Ultra là 'đỉnh cao' trong gia đình ba mô hình cùng chia sẻ kiến trúc lai Mamba-Transformer MoE .
Cả ba đều hỗ trợ cửa sổ ngữ cảnh lên đến 1 triệu token. Các biến thể Super và Ultra bao gồm huấn luyện NVFP4, LatentMoE và các lớp dự đoán đa token .
Được giới thiệu lần đầu tại GTC 2026 vào tháng 3 và nhắc lại tại Computex, NemoClaw và OpenShell tạo thành 'bộ công cụ tác nhân' doanh nghiệp của Nvidia . Đây giống như một 'bộ giáp' bảo vệ và 'luật chơi' cho các tác nhân AI hoạt động trong doanh nghiệp.
CPU Nvidia Vera là bộ xử lý kiến trúc Arm tùy chỉnh được thiết kế chuyên biệt để điều phối khối lượng công việc AI trong các trung tâm dữ liệu. Nó đóng vai trò như 'nhạc trưởng' cho dàn nhạc GPU khổng lồ .
CPU Vera đóng vai trò là bộ xử lý chủ bên trong các hệ thống quy mô rack Vera Rubin NVL72, nơi nó làm việc cùng với các GPU thế hệ mới để cung cấp năng lượng cho các 'nhà máy AI' .
RTX Spark là 'hệ thống trên chip' (SoC) chuyên dụng đầu tiên của Nvidia dành cho PC Windows tiêu dùng, được đồng phát triển với MediaTek và xây dựng trên tiến trình 3nm của TSMC . Jensen Huang đã mô tả nó như là "tất cả những gì chúng tôi học được trong 33 năm qua được chắt lọc vào một con chip"
. Đây chính là 'trái tim' mới cho kỷ nguyên PC AI.
Nvidia định vị RTX Spark là "PC Windows đầu tiên trên thế giới được thiết kế chuyên biệt cho các tác nhân cá nhân" .
Nvidia xác nhận rằng nền tảng Vera Rubin đã bước vào giai đoạn sản xuất hàng loạt toàn diện, với các hệ thống dự kiến sẽ đến tay các đối tác vào nửa cuối năm 2026 . Đây là 'cỗ máy' sẽ vận hành các nhà máy AI của tương lai.
Tổng hợp lại, Computex 2026 là màn trình diễn rõ ràng nhất về chiến lược tích hợp theo chiều dọc của Nvidia:
Thông điệp trong bài phát biểu của CEO Jensen Huang là duy nhất và xuyên suốt: Nvidia hiện cung cấp mọi lớp của 'ngăn xếp' AI, từ silicon và các mô hình mở cho đến thời gian chạy tác nhân và hạ tầng triển khai quy mô nhà máy.
Comments
0 comments