Cách tiếp cận mô-đun này cho phép mỗi rack được tối ưu hóa cho một chức năng cụ thể—đào tạo, suy luận, mạng hoặc lưu trữ—trong khi vẫn vận hành như một siêu máy tính logic duy nhất.
Việc tăng tốc sản xuất mang tính toàn cầu. Nvidia xác nhận có hàng trăm đối tác trong hệ sinh thái chuỗi cung ứng đang sản xuất các hệ thống Vera Rubin, với hơn 150 đối tác trong số đó chỉ riêng tại Đài Loan . Hoạt động sản xuất trải dài trên hơn 350 nhà máy tại 30 quốc gia, một tín hiệu rõ ràng cho thấy Nvidia đang chuẩn bị cho khối lượng lớn để đáp ứng nhu cầu từ các phòng thí nghiệm AI, nhà cung cấp đám mây và các đại gia siêu quy mô (hyperscalers)
. Các nhà sản xuất hệ thống hàng đầu đang trong giai đoạn sản xuất toàn diện bao gồm Dell Technologies, HPE, Lenovo và Supermicro
.
Chỉ trong vòng một ngày sau bài phát biểu tại GTC Taipei, CoreWeave thông báo đã hoàn tất quá trình khởi động và xác nhận hệ thống Vera Rubin NVL72 đầu tiên trong ngành trên nền tảng đám mây của mình . Thông báo xác nhận cụm rack này mang lại hiệu suất suy luận trên mỗi watt cao gấp 10 lần so với các thế hệ trước, cùng với việc giảm số lượng GPU cần thiết cho các tác vụ quy mô lớn
. Tốc độ đưa vào vận hành một hệ thống đầy đủ của CoreWeave nhấn mạnh mối quan hệ hợp tác kỹ thuật sâu rộng của họ với Nvidia và định vị họ là nhà cung cấp truy cập sớm hàng đầu cho thế hệ Rubin.
CPU Vera là một điểm khác biệt quan trọng của nền tảng. Được mô tả là CPU trung tâm dữ liệu độc lập đầu tiên của Nvidia, nó đã bước vào giai đoạn sản xuất hàng loạt với các lô hàng dự kiến bắt đầu vào nửa cuối năm 2026 . Nvidia đã thiết kế con chip này đặc biệt cho các yêu cầu của tác nhân AI tự động, vốn cần xử lý băng thông cao, độ trễ thấp trên các vùng nhớ khổng lồ. Các khách hàng đầu tiên đã được xác nhận cho CPU Vera bao gồm OpenAI, Anthropic và SpaceX
.
Việc chuyển sang sản xuất hàng loạt cho Vera Rubin báo hiệu một sự chuyển dịch lớn trong toàn ngành hướng tới cơ sở hạ tầng được thiết kế riêng cho AI tác nhân—những hệ thống không chỉ tạo ra phản hồi mà còn có thể lập luận, lập kế hoạch và thực thi các hành động nhiều bước. Bằng cách tích hợp trực tiếp công nghệ suy luận độ trễ thấp của Groq vào kiến trúc POD, Nvidia đang nhắm đến một lớp khối lượng công việc mới nơi tốc độ và hiệu quả suy luận là tối quan trọng .
Nền tảng dự kiến sẽ được cung cấp rộng rãi cho các nhà cung cấp đám mây và doanh nghiệp vào nửa cuối năm 2026, với AWS, Google Cloud, Microsoft Azure và Oracle Cloud Infrastructure đều có tên trong danh sách dự kiến triển khai sớm . Xét đến việc Vera Rubin đã được công bố là đang trong quá trình sản xuất tại CES vào tháng 1 và một lần nữa tại GTC vào tháng 3, bản cập nhật tại GTC Taipei lần này xác nhận đà tăng tốc vẫn được duy trì và hiện được hỗ trợ bởi một chuỗi cung ứng toàn cầu có quy mô đầy đủ
.
Comments
0 comments