Переход от двухсокетной компоновки Graviton4 к монолитному кристаллу Graviton5 полностью устраняет накладные расходы на обмен данными между сокетами. Для нагрузок, активно использующих много ядер (конвейеры инференса в реальном времени, in-memory базы данных, крупные парки микросервисов), одно только снижение задержки способно дать ощутимый прирост пропускной способности ещё до учёта каких-либо улучшений в IPC (числе инструкций за такт).
Официальные показатели AWS согласуются со сторонним анализом и ранними клиентскими тестами:
Вычисления и пропускная способность:
Подсистема ввода-вывода:
Реальные результаты клиентов:
Эти цифры согласуются с архитектурными изменениями. Увеличенный в пять раз кэш L3 сокращает дорогостоящие обращения к DRAM — особенно заметно для баз данных и аналитических нагрузок, обходящих крупные рабочие наборы. Более быстрая память DDR5-8800 и шина PCIe Gen 6 снимают узкие места по пропускной способности, ограничивавшие производительность предыдущих поколений. Наконец, переход на односокетную компоновку убирает «налог на задержку», который масштабируемые приложения платят на NUMA-архитектурах.
Для рабочих нагрузок, требующих скоростного эфемерного хранилища, подключённого напрямую к инстансу, AWS предлагает вариант M9gd. Он добавляет поверх той же вычислительной платформы Graviton5 локальное блочное хранилище на базе NVMe SSD: до 11,4 ТБ ёмкости с IOPS на 30% выше, чем у локального хранилища предыдущего поколения .
M9gd ориентирован на сценарии вроде крупных кэширующих кластеров, конвейеров обработки логов и движков аналитики в реальном времени — везде, где близость данных к процессору напрямую влияет на задержку запросов и общую пропускную способность. Сочетание более быстрых ядер, меньшей межъядерной задержки и повышенных IOPS локального хранилища делает M9gd естественным выбором для любой нагрузки, выигрывающей от сокращения промежутка «хранилище — вычисления».
Одно из заметных изменений в позиционировании Graviton5 — явная ставка AWS на рабочие нагрузки агентного ИИ (agentic AI): системы, которые выполняют логические рассуждения в реальном времени, генерацию кода и многошаговую оркестровку задач с использованием больших языковых моделей и других техник генеративного ИИ .
Хотя в диалоге об обучении моделей и массовом инференсе доминируют GPU-ускорители, агентный ИИ в масштабе создаёт иной вычислительный паттерн: непрерывную высокопроизводительную работу CPU, чередующую этапы инференса модели и логику оркестровки, с жёсткими бюджетами задержек для многократных взаимодействий. AWS аргументирует, что сниженная на 33% межъядерная задержка, увеличенный в пять раз кэш и высокое число ядер на инстанс делают Graviton5 хорошо подходящим для таких задач, когда их нужно развернуть в продуктовом масштабе без экономики GPU .
Самое технически значимое дополнение платформы Graviton5, выходящее за рамки «голой» производительности, — Nitro Isolation Engine, новый компонент шестого поколения системы AWS Nitro .
Реализованный на языке Rust, Nitro Isolation Engine представляет собой минимальный специализированный компонент гипервизора, отвечающий за обеспечение изоляции между совместно размещёнными виртуальными машинами . Что отличает его от любого другого промышленного гипервизора — формальная верификация. AWS подготовила машинно-проверяемые доказательства с использованием инструмента Isabelle, которые математически демонстрируют
:
С практической точки это означает, что AWS может предоставить математическую определённость в том, что нагрузки одного клиента не могут получить доступ к данным другого или повлиять на их исполнение, и что сами операторы AWS подчиняются тем же границам изоляции . AWS обязалась предоставить реализацию Nitro Isolation Engine и соответствующие доказательства для аудита клиентами
.
На инстансах M9g этот движок включён по умолчанию . Это меняет саму парадигму обеспечения безопасности в облаке: от эксплуатационного контроля и аудиторских нарративов — к машинно-проверяемым гарантиям фундаментального слоя изоляции.
Среди названных поимённо ранних пользователей и партнёров по тестированию — Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian и ClickHouse, а также HubSpot и другие, идентифицированные благодаря раскрытию данных о производительности .
Клиентские результаты охватывают несколько категорий нагрузок:
Эти результаты отражают закономерность, видимую по всей кривой внедрения Graviton: большинство нагрузок ощущают немедленный прирост производительности без изменений кода или с минимальными правками при миграции с x86 на Arm, и выигрыш накапливается от поколения к поколению по мере совершенствования кремния .
Graviton5 появляется в момент, когда серверный кремний на Arm перешёл из разряда «средства оптимизации затрат» в массовый выбор по производительности. Более половины новых процессорных мощностей AWS последние три года приходилось на Graviton, а 98% из первой тысячи клиентов EC2 уже используют инстансы на базе Graviton .
Монолитный 192-ядерный кристалл на техпроцессе 3 нм, поддержка PCIe Gen 6, память DDR5-8800 и добавление формально верифицированной изоляции рабочих нагрузок — всё это поднимает планку не только для собственных семейств инстансов AWS, но и для того, что клиенты в принципе могут ожидать от облачных вычислений: производительность, энергоэффективность и гарантии безопасности, опирающиеся на математическое доказательство, а не на эксплуатационные обещания.
Общая доступность M9g и M9gd означает, что все эти возможности теперь доступны через стандартные пути внедрения EC2. Ожидается, что за ними последуют варианты C9g (compute-optimized) и R9g (memory-optimized) .
Comments
0 comments