Tầm nhìn của NVIDIA là biến DSX OS trở thành nền tảng tiêu chuẩn cho các nhà máy AI, tương tự cách hệ điều hành mã nguồn mở đã trở thành trụ cột của hạ tầng đám mây. Việc mở mã nguồn giúp các đối tác có thể tùy biến sâu, giảm thiểu sự phân mảnh và thúc đẩy đổi mới dựa trên cộng đồng .
Đây là bộ công cụ phần mềm quản lý năng lượng và hiệu suất, giải quyết bài toán đau đầu nhất của các trung tâm dữ liệu: điện năng. DSX MaxLPS có khả năng phân bổ điện năng động ở cấp độ GPU, tủ rack và khối lượng công việc để khai thác tối đa token sinh ra trên mỗi megawatt trong một ngân sách điện cố định .
Điểm nhấn công nghệ nằm ở sự kết hợp giữa hệ thống tản nhiệt lỏng nhiệt độ cao 45 độ C và cơ chế cấp phát điện năng chi tiết. Nhờ đó, các nhà máy AI có thể vận hành thêm tới 40% số lượng GPU ở điểm hiệu suất điện năng cao nhất mà không cần nâng cấp đường truyền tải hay hợp đồng điện, từ đó giảm đáng kể chi phí token đầu ra .
Khi các nhà máy AI tiêu thụ điện năng cỡ hàng trăm megawatt, chúng có thể trở thành gánh nặng cho lưới điện. NVIDIA giải quyết vấn đề này bằng DSX Flex — một bộ điều phối giúp kết nối nhà máy AI với các dịch vụ của lưới điện. Phần mềm này cho phép khối lượng công việc AI thích ứng một cách linh hoạt với các tín hiệu từ lưới điện, chẳng hạn như yêu cầu cắt giảm phụ tải (load shedding), phản hồi nhu cầu (demand response) hoặc thay đổi giá điện theo giờ .
Thực tế, công nghệ này không chỉ nằm trên giấy. NVIDIA đang triển khai một dự án thử nghiệm thương mại quy mô nhiều megawatt với Silicon Valley Power, cho thấy khả năng bảo vệ hiệu suất các tác vụ AI ưu tiên cao trong khi vẫn đảm bảo sự ổn định và chi phí hợp lý cho lưới điện .
Để biến DSX thành chuẩn mực toàn cầu, NVIDIA đã công bố hợp tác với các nhà sản xuất hệ thống hàng đầu tại Đài Loan để mở rộng hệ sinh thái. Đây là động thái chiến lược tận dụng thế mạnh sản xuất phần cứng của các đối tác lâu năm .
Bên cạnh đó, hàng loạt 'ông lớn' điện toán đám mây đang triển khai các thành phần cốt lõi của DSX (bao gồm DSX Sim, DSX MaxLPS và DSX OS), có thể kể đến: CoreWeave, Crusoe, Firmus, IREN, Lambda, Nebius, Nscale và Yotta Data Services. Mục tiêu chung là nhanh chóng đưa năng lực điện toán AI lên đám mây, giảm thiểu rủi ro và tối ưu hóa hiệu suất sử dụng GPU .
Comments
0 comments