Такой модульный подход позволяет оптимизировать каждую стойку под конкретную функцию — обучение, инференс, сеть или хранение — при этом все они работают как единый логический суперкомпьютер.
Запуск производства носит глобальный характер. Nvidia подтвердила, что сотни партнеров по всей экосистеме задействованы в производстве систем Vera Rubin, причем более 150 из них находятся только на Тайване . Производство развернуто на более чем 350 заводах в 30 странах, что является явным сигналом о подготовке к огромным объемам для удовлетворения спроса со стороны ИИ-лабораторий, облачных провайдеров и гиперскейлеров
. Среди ключевых сборщиков систем, участвующих в полномасштабном производстве, — Dell Technologies, HPE, Lenovo и Supermicro
.
Уже через день после основного доклада на GTC Taipei компания CoreWeave объявила о первом в отрасли запуске и валидации системы Vera Rubin NVL72 в своем облаке CoreWeave Cloud . В заявлении подтверждалось, что стойка обеспечивает до 10-кратного увеличения производительности инференса на ватт по сравнению с предыдущими поколениями, а также требует меньше GPU для крупномасштабных задач
. Скорость, с которой CoreWeave развернула полностью работающую систему, подчеркивает ее глубокое инженерное партнерство с Nvidia и делает компанию ведущим провайдером раннего доступа к поколению Rubin.
Процессор Vera является ключевым отличием платформы. Описанный как первый самостоятельный серверный CPU от Nvidia, он поступил в массовое производство, а его поставки ожидаются во второй половине 2026 года . Nvidia разработала этот чип специально для нужд автономных ИИ-агентов, которым требуется высокая пропускная способность и низкая задержка при работе с огромными пулами памяти. Среди первых подтвержденных заказчиков Vera CPU — OpenAI, Anthropic и SpaceX
.
Переход к полномасштабному производству Vera Rubin сигнализирует о более широком отраслевом сдвиге в сторону специализированной инфраструктуры для агентного ИИ — систем, которые не только генерируют ответы, но и способны рассуждать, планировать и выполнять многошаговые действия. Интегрируя технологию низколатентного инференса от Groq непосредственно в архитектуру POD, Nvidia нацеливается на новый класс рабочих нагрузок, где скорость и эффективность вывода имеют первостепенное значение .
Ожидается, что платформа станет общедоступной для облачных провайдеров и предприятий во второй половине 2026 года. В числе первых, кто ее развернет, названы AWS, Google Cloud, Microsoft Azure и Oracle Cloud Infrastructure . Учитывая, что о запуске Vera Rubin в производство уже объявлялось на CES в январе и на GTC в марте, обновление на GTC Taipei подтверждает, что процесс наращивания производства идет по плану и теперь подкреплен полностью масштабированной глобальной цепочкой поставок
.
Comments
0 comments