Перехід від двосокетної архітектури Graviton4 до монолітного кристала Graviton5 повністю усуває накладні витрати на обмін даними між сокетами. Для робочих навантажень, що розподіляються на велику кількість ядер — як-от конвеєри обробки даних у реальному часі, резидентні бази даних чи масштабовані мікросервісні платформи — одне лише зниження затримки може дати відчутний приріст пропускної здатності без урахування покращень у продуктивності окремих інструкцій (IPC).
Показники, оприлюднені AWS, підтверджуються незалежними аналітиками та ранніми тестами клієнтів:
Обчислення та пропускна здатність:
Мережа та введення/виведення:
Результати клієнтів у реальних умовах:
Ці цифри узгоджуються з архітектурними змінами. Збільшений у 5 разів кеш L3 зменшує кількість дорогих звертань до оперативної пам'яті, що особливо важливо для баз даних та аналітики з великими робочими наборами даних. Швидша пам'ять DDR5-8800 та введення/виведення PCIe Gen 6 знімають обмеження пропускної здатності, які стримували продуктивність у попередніх поколіннях. А перехід на односокетний дизайн зменшує податок на затримку, який сплачують масштабовані застосунки в системах з NUMA-архітектурою.
Для завдань, що потребують високошвидкісного ефемерного сховища, безпосередньо підключеного до інстансу, AWS пропонує варіант M9gd. Ці інстанси додають локальне блочне сховище на базі NVMe SSD до тієї ж обчислювальної платформи Graviton5, забезпечуючи до 11,4 ТБ локальної ємності NVMe SSD із на 30% вищим IOPS порівняно з попереднім поколінням .
Варіант M9gd націлений на такі сценарії, як великі кешувальні кластери, конвеєри обробки логів та аналітичні системи реального часу, де близькість даних до процесора безпосередньо впливає на затримку запитів і загальну пропускну здатність. Поєднання швидших ядер, меншої між'ядерної затримки та вищого IOPS локального сховища робить M9gd природним вибором для будь-яких завдань, де виграш дає скорочення відстані між сховищем і обчисленнями.
Одним із найпомітніших зрушень у позиціонуванні Graviton5 є відкрите націлювання AWS на робочі навантаження агентного ШІ — системи, які виконують міркування в реальному часі, генерацію коду та багатокрокову оркестрацію завдань із використанням великих мовних моделей та інших генеративних технологій .
Хоча GPU та прискорювачі домінують у сфері тренування моделей і пакетного інференсу, агентний ШІ в масштабі створює інший обчислювальний патерн: безперервну високопродуктивну роботу CPU, яка чергує кроки інференсу моделі з логікою оркестрації, з жорсткими обмеженнями на затримку для багатокрокових взаємодій. AWS стверджує, що на 33% нижча між'ядерна затримка, у 5 разів більший кеш і висока щільність ядер в одному інстансі роблять Graviton5 ідеально придатним для таких навантажень, коли їх потрібно запускати в промислових масштабах без економічних витрат на GPU .
Окрім продуктивності, найважливішим технічним доповненням до платформи Graviton5 є Nitro Isolation Engine — новий компонент системи AWS Nitro шостого покоління .
Реалізований на мові Rust, Nitro Isolation Engine є мінімальним, спеціально створеним компонентом гіпервізора, який відповідає за забезпечення ізоляції між віртуальними машинами різних клієнтів . Те, що відрізняє його від усіх інших промислових гіпервізорів, — це формальна верифікація: AWS створила машинно-перевірювані докази за допомогою помічника доведення теорем Isabelle, які математично демонструють
:
На практиці це означає, що AWS може надати математичну впевненість у тому, що робочі навантаження одного клієнта не можуть отримати доступ до даних іншого або вплинути на їх виконання, а також що на операторів AWS поширюються ті самі межі ізоляції . AWS зобов'язалася надати реалізацію та відповідні докази для Nitro Isolation Engine для перевірки клієнтами
.
Цей механізм увімкнено за замовчуванням на інстансах M9g . Це знаменує собою зсув у гарантуванні хмарної безпеки: від операційних контролів та аудиторських наративів до машино-перевірюваних гарантій фундаментального рівня ізоляції.
Серед названих перших користувачів і партнерів з тестування — Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian і ClickHouse, а також HubSpot та інші, чиї результати були оприлюднені .
Результати клієнтів охоплюють кілька категорій навантажень:
Ці результати відображають загальну тенденцію впровадження Graviton: більшість робочих навантажень отримують негайне покращення продуктивності без змін коду або з мінімальними змінами при переході з x86 на Arm, і цей виграш зростає з кожним новим поколінням .
Graviton5 з'являється в той момент, коли серверні рішення на базі Arm перетворилися з альтернативи для оптимізації витрат на основний вибір для високопродуктивних обчислень. Понад половина нових обчислювальних потужностей в AWS протягом останніх трьох років працювала на Graviton, і 98% з першої тисячі клієнтів EC2 вже використовують інстанси на базі Graviton .
З монолітним 192-ядерним кристалом, виготовленим за 3-нм техпроцесом, підтримкою PCIe Gen 6, пам'яттю DDR5-8800 та додаванням формально верифікованої ізоляції робочих навантажень, Graviton5 піднімає планку не лише для власних сімейств інстансів AWS, але й для того, що клієнти можуть обґрунтовано очікувати від хмарних обчислень: продуктивності, енергоефективності та гарантій безпеки, підкріплених математичним доказом, а не операційними обіцянками.
Загальна доступність інстансів M9g та M9gd означає, що ці можливості тепер доступні через стандартні шляхи впровадження EC2, а на черзі — очікувані варіанти C9g (оптимізовані для обчислень) та R9g (оптимізовані для роботи з пам'яттю) .
Comments
0 comments