Компания описывает современные дата‑центры как «AI‑фабрики» — огромные вычислительные комплексы, производящие ответы моделей в промышленном масштабе. В такой архитектуре:
Классические серверные процессоры проектировались для стандартных задач облачных сервисов — веб‑приложений, баз данных и виртуализации.
Но агентные системы работают иначе.
ИИ‑агент не просто генерирует ответ. Обычно он выполняет цепочку действий:
Все эти операции происходят вне самой нейросети, но должны выполняться быстро, чтобы дорогостоящие GPU не простаивали.
Компания утверждает, что процессор может выполнять такие задачи примерно в два раза эффективнее и на 50% быстрее, чем традиционные серверные CPU в аналогичных сценариях.
Архитектурно Vera включает 88 пользовательских Arm‑совместимых ядер Olympus с высокой пропускной способностью памяти, рассчитанных на крупные системы ИИ.
Vera не заменяет GPU — он действует как координационный центр вычислительной системы.
В платформе следующего поколения Vera Rubin несколько типов чипов объединяются в единую архитектуру дата‑центра:
Например, система Vera Rubin NVL72 объединяет:
В такой системе CPU отвечает за:
Это помогает поддерживать максимальную загрузку ускорителей, которые являются самой дорогой частью инфраструктуры.
По мнению Nvidia, развитие ИИ движется от простых генеративных моделей к автономным агентам, которые выполняют многоэтапные задачи.
Каждый такой агент может:
Это резко увеличивает объём вычислений, необходимых для управления процессом. Некоторые аналитики считают, что потребность в вычислениях для агентного ИИ может быть на порядки выше, чем для ранних генеративных моделей.
В такой системе CPU становятся своего рода «плоскостью управления» всей ИИ‑инфраструктуры.
Если в облачных сервисах одновременно работают миллиарды агентов, именно CPU будут:
Выход Vera означает, что Nvidia начинает активнее конкурировать на рынке серверных CPU.
Стратегия Nvidia отличается: компания делает ставку не на отдельный процессор, а на полностью интегрированную систему.
В архитектуре Vera Rubin Nvidia проектирует вместе:
Компания утверждает, что такая вертикальная интеграция позволяет снизить стоимость вычислений на один токен и повысить производительность для крупных ИИ‑сервисов.
При этом конкуренция остаётся серьёзной: облачные компании имеют сильный стимул разрабатывать собственные чипы, чтобы снизить зависимость от Nvidia.
Появление Vera показывает более глубокую трансформацию компании.
Nvidia постепенно позиционирует себя не просто как производителя GPU, а как поставщика полной инфраструктуры для искусственного интеллекта — от процессоров и сетевых технологий до целых стоек дата‑центров.
Если прогноз Хуанга о росте автономных ИИ‑агентов окажется верным, такие CPU, как Vera, могут стать ключевой частью будущих «AI‑фабрик» — и превратить рынок вычислений для ИИ в гораздо более крупную экосистему, чем эпоха одних только GPU.
Comments
0 comments