Это партнерство выходит далеко за рамки стандартного ASIC-проекта. FuriosaAI и Broadcom не просто «делают быстрый чип», они строят готовую платформу для вывода ИИ-моделей, которая устраняет системные узкие места гипермасштабируемых дата-центров .
Чарли Каввас, президент Broadcom Semiconductor Solutions Group, описывает суть проекта так: «Производительность инференса больше не определяется только „сырыми“ вычислениями… Объединяя архитектуру TCP Furiosa с нашей XPU-платформой, Ethernet-соединениями и фабриками-коммутаторами, мы строим решение, которое убирает ключевые помехи для крупномасштабного агентного ИИ» . Система задумана с топологией «все-ко-всем» — это критически важно для сложных коммуникационных паттернов, которые порождают Mixture-of-Experts (MoE) модели
.
FuriosaAI выходит на сделку с работающим кремнием в багаже. Чип второго поколения под названием RNGD уже серийно выпускается на 5-нм техпроцессе TSMC . RNGD — это плата PCIe с тепловыделением 180 Вт, выдающая 512 терафлопс в вычислениях FP8 с 48 ГБ памяти HBM3 и пропускной способностью 1,5 ТБ/с. По сравнению с Nvidia B200 у него примерно в 9 раз меньше пиковая производительность, но достигается она при примерно в 5 раз меньшем энергопотреблении
.
RNGD прошел проверку крупными корейскими корпорациями, включая Samsung SDS и LG AI Research — LG уже запускает на нем свое семейство моделей Exaone . Такой коммерческий опыт дает стартапу серьезные козыри, когда он претендует на глобальный гиперскейлер-рынок с платформой третьего поколения.
Одно из ключевых отличий FuriosaAI — программный стек. SDK компании использует универсальный компилятор, который автоматически сопоставляет код PyTorch с их «железом», снимая нужду в ручном написании CUDA-ядер. Технология Virtual ISA оставляет разработчикам низкоуровневый контроль, но без сложностей программирования под GPU .
Философия стартапа в том, что классические GPU несут в себе «наследный налог» своего графического происхождения. Архитектура SIMT, по мнению компании, неэффективна при нерегулярных запросах к памяти, которые типичны для современных задач инференса. FuriosaAI разработала архитектуру Tensor Contraction Processor (TCP) с чистого листа, сделав ставку на высокую пропускную способность при работе с данными и массивные тензорные операции вместо управления потоками. Цель — больше производительности на ватт и выше плотность генерируемых токенов в стойках с ограниченным энергопотреблением .
Сделка FuriosaAI — лишь последнее звено в масштабной стратегии Broadcom по развитию заказного кремния. В октябре 2025 года о многолетнем партнерстве с Broadcom объявила OpenAI: компании договорились совместно разработать и развернуть колоссальный объем в 10 гигаватт кастомных AI-ускорителей и сетевого оборудования с запуском первой очереди во второй половине 2026 года на базе 3-нм и 2-нм проектов . В портфеле заказчиков Broadcom по кастомным ASIC также значатся Microsoft, Amazon, Meta и Google — все они вкладывают миллиарды долларов в проектирование специализированных чипов под свои AI-задачи
.
Эта волна партнерств отражает структурные изменения на рынке. По данным исследовательской компании TrendForce, в 2026 году доля AI-серверов на базе ASIC достигнет 27,8% от общего числа поставок — это многолетний максимум, — а к 2030 году прогнозируется рост почти до 40% . Темпы роста особенно показательны: по оценкам TrendForce, отгрузки кастомных AI-чипов у облачных провайдеров вырастут в 2026 году на 44,6%, что почти в три раза выше прогноза в 16,1% для универсальных GPU
.
Nvidia по-прежнему контролирует около 70% рынка AI-чипов, однако эта доля будет снижаться по мере того, как гиперскейлеры переходят на собственные решения, которые могут дать лучшую эффективность для их уникальных программных стеков . Платформа FuriosaAI–Broadcom — это прямой шаг в русле этого тренда: стартап пытается совершить прыжок от проверенной 180-ваттной платы для инференса до 2-нм системы на Ethernet-фабрике, спроектированной под самые большие дата-центры мира.
Comments
0 comments