Bổ sung cho lớp điều phối là OpenShell, một môi trường thực thi biệt lập, an toàn, có nhiệm vụ thực thi các biện pháp kiểm soát quyền riêng tư khi lưu trữ và chạy các tác nhân trên bất kỳ nền tảng chuyên dụng nào—dù là máy trạm RTX, máy ảo trên đám mây hay máy DGX Station mới . Cùng với nhau, NemoClaw và OpenShell tạo ra một môi trường vận hành biệt lập cho các "đồng nghiệp số", có thể chạy vô thời hạn mà không làm lộ dữ liệu nhạy cảm.
Cung cấp trí thông minh cho các tác nhân đó là Nemotron 3 Ultra, một mô hình mã nguồn mở 550 tỷ tham số mà Nvidia tuyên bố là mô hình mở mạnh mẽ nhất từng được một công ty Mỹ phát hành . Nó nằm ở đỉnh cao của gia đình Nemotron 3, trên cả hai mô hình Nano (4 tỷ tham số) và Super (120 tỷ tham số) đã ra mắt trước đó
.
Theo tài liệu chính thức và sách trắng của Nvidia, mô hình này sử dụng kiến trúc lai Mamba-Transformer kết hợp hỗn hợp chuyên gia (MoE) . Thiết kế này cho phép kích hoạt lên đến khoảng 55 tỷ tham số cho mỗi token trong khi vẫn duy trì hiệu quả tính toán cao
. Nvidia cho biết điều này mang lại khả năng suy luận nhanh gấp 5 lần và chi phí thấp hơn tới 30% cho các tác vụ tự chủ phức tạp so với các thế hệ trước
.
Điểm mấu chốt là Nemotron 3 Ultra sở hữu một cửa sổ ngữ cảnh 1 triệu token gốc. Blog dành cho nhà phát triển của Nvidia nhấn mạnh đây là chìa khóa cho khả năng suy luận bền vững trên các kho mã nguồn khổng lồ, nghiên cứu sâu trên nhiều tài liệu và bộ nhớ tác nhân hoạt động dài hạn mà không gặp phải tình trạng phân mảnh thường thấy khi sử dụng các phương pháp chia nhỏ thô sơ . Mô hình này dự kiến được phát hành mở vào ngày 4 tháng 6 năm 2026
.
Nvidia đã hoàn thiện hệ thống từ chip đến phần mềm với sự ra mắt của DGX Station for Windows. Được quảng bá là siêu máy tính AI để bàn mạnh nhất thế giới, hệ thống này được thiết kế để đưa sự phát triển AI quy mô hàng đầu trực tiếp đến bàn làm việc của doanh nghiệp, chạy hệ điều hành Windows một cách tự nhiên .
Được trang bị Siêu chip NVIDIA GB300 Grace Blackwell Ultra Desktop mới, DGX Station kết hợp GPU Blackwell Ultra với CPU Grace 72 lõi thông qua kết nối tốc độ cao NVLink-C2C, tạo ra một vùng nhớ thống nhất và đồng bộ lên đến 748 GB . Kết quả là một hệ thống mang lại hiệu suất tính toán AI lên đến 20 petaflops FP4, có khả năng chạy các mô hình AI hàng đầu với tối đa 1 nghìn tỷ tham số hoàn toàn cục bộ, hoặc hỗ trợ hàng trăm tác nhân AI song song cùng lúc
.
Đây là một nước đi trực tiếp nhằm chuyển đổi hoạt động phát triển AI doanh nghiệp từ các phiên bản đám mây dùng chung sang phần cứng cục bộ chuyên dụng và luôn sẵn sàng. Nvidia công bố DGX Station for Windows sẽ có mặt vào quý 4 năm 2026 thông qua hệ sinh thái các nhà sản xuất OEM .
Nvidia không chỉ ra mắt sản phẩm; họ ra mắt chúng cùng với một liên minh các đối tác doanh nghiệp đã cam kết trước, sẵn sàng nhúng hệ thống này vào các sản phẩm cốt lõi của họ .
Các công ty hàng đầu về phần mềm kỹ thuật và thiết kế vi mạch (EDA) là những người tiên phong. Cadence, Dassault Systèmes, Siemens và Synopsys đã công bố kế hoạch sử dụng khung NemoClaw để xây dựng các kỹ sư AI tự chủ. Những "đồng nghiệp số" này được thiết kế để thực thi các quy trình mô phỏng và xác minh phức tạp, một nhiệm vụ mà Nvidia tuyên bố có thể rút ngắn từ vài tuần làm việc kỹ thuật xuống chỉ còn vài giờ .
Trong lĩnh vực an ninh mạng và phân tích dữ liệu, CrowdStrike và Palantir đang tích hợp nền tảng tác nhân này để vận hành các tác nhân tự chủ hoạt động lâu dài, sử dụng các mô hình mở Nemotron, với mục tiêu cho phép các nhóm an ninh và vận hành phân tích dữ liệu nhanh hơn một cách đột phá .
Về phía phần cứng và nền tảng, Microsoft đang hợp tác để mang đến trải nghiệm Windows gốc cho các tác nhân cá nhân và doanh nghiệp, kết nối liền mạch với các ứng dụng Windows . Các nhà sản xuất hệ thống Dell, HP và ASUS đều được nêu tên là đối tác OEM cho dòng máy DGX Station để bàn, đảm bảo siêu máy tính này sẽ được phổ biến rộng rãi thông qua các kênh mua sắm CNTT tiêu chuẩn của doanh nghiệp
.
Với những bước đi tại GTC Taipei, Nvidia đã định vị mình không chỉ là nhà cung cấp linh kiện cho kỷ nguyên AI tự chủ, mà còn là kiến trúc sư của một hệ thống hoàn chỉnh, mở và sẵn sàng cho doanh nghiệp—từ trọng số mô hình cho đến máy trạm đặt ngay tại văn phòng.
Comments
0 comments