Однако низкоуровневый подход имеет цену: всю обвязку, которую JAX или PyTorch дают «из коробки» (автоматическое дифференцирование, готовые оптимизаторы, динамическое управление памятью), инженерам SpaceX пришлось писать с нуля .
Более того, дорожная карта идёт дальше обучения. Уже подтверждено, что следующим этапом будет создание C-стека для инференса, заточенного под высокоскоростное обучение с подкреплением на больших блоках GB300. Маск отдельно отметил, что разрабатываемая технология пригодится не только SpaceX, но и его AI-компании xAI, а также Tesla .
Откуда взялась цифра 10x и можно ли ей верить
Заявление действительно радикальное: утверждается, что на крупномасштабных задачах их стек «более чем в 10 раз быстрее JAX» . В истории ИИ десятикратные скачки эффективности обычно требовали смены архитектуры чипов или фундаментально новых алгоритмов, а не только переписывания софта.
Для контекста: хорошо оптимизированное масштабирование даже на JAX не даёт волшебных чисел. В практическом руководстве Lambda Labs от января 2026 года обучение 27-миллионного трансформера на 16 ускорителях Nvidia Blackwell показало прирост пропускной способности всего в 4,08 раза по сравнению с одним GPU — и это далеко не 10-кратный прирост на каждом устройстве.
Почему к заявлению пока стоит отнестись с осторожностью:
К чему всё это идёт
SpaceX присоединяется к очень короткому списку игроков, готовых полностью отказаться от стандартных фреймворков ради предельной производительности. Большинство компаний считают, что продуктивность разработки перевешивает сырую эффективность «железа». SpaceX, очевидно, делает противоположную ставку — она полагает, что при масштабе в 220 000 GPU расходы на создание уникального C-стека окупаются экономией каждого процента утилизации.
Оправдается ли ставка, зависит от того, подтвердится ли обещанный десятикратный прирост под пристальным взглядом независимых экспертов. Пока же это выдающаяся инженерная амбиция, а не доказанный факт.
Comments
0 comments