Przejście z dwugniazdowej konstrukcji Graviton4 na monolityczną kość Graviton5 całkowicie eliminuje narzut związany z komunikacją między gniazdami. Dla obciążeń rozproszonych na wiele rdzeni – takich jak potoki wnioskowania w czasie rzeczywistym, bazy danych w pamięci czy wielkoskalowe floty mikrousług – sama redukcja opóźnień może przynieść wymierny wzrost przepustowości.
Opublikowane przez AWS wyniki są spójne z analizami niezależnych ekspertów i wczesnymi testami klientów:
Wydajność obliczeniowa i przepustowość:
I/O i przepustowość sieci:
Rzeczywiste wyniki klientów:
Liczby te są spójne ze zmianami architektonicznymi. Pięciokrotnie większa pamięć podręczna L3 redukuje kosztowne dostępy do pamięci DRAM, co jest szczególnie istotne dla baz danych i analityki. Szybsza pamięć DDR5-8800 i interfejs PCIe Gen 6 usuwają wąskie gardła przepustowości. Przejście na konstrukcję jednogniazdową eliminuje podatek od opóźnień, który dotyka aplikacje skalowalne w architekturze NUMA.
Dla obciążeń wymagających szybkiej, ulotnej pamięci masowej bezpośrednio przy instancji, AWS oferuje wariant M9gd. Instancje te łączą platformę obliczeniową Graviton5 z lokalną pamięcią blokową NVMe SSD, oferując do 11,4 TB pojemności z o 30% wyższą liczbą IOPS (operacji wejścia/wyjścia na sekundę) niż poprzednia generacja .
Wariant M9gd jest skierowany do zastosowań takich jak duże floty buforowania (cache), potoki przetwarzania logów i silniki analityczne czasu rzeczywistego, gdzie trzymanie danych jak najbliżej CPU bezpośrednio wpływa na opóźnienia i przepustowość.
Jedną z bardziej zauważalnych zmian jest wyraźne wskazanie przez AWS obciążeń związanych z AI agentowym – systemów zdolnych do rozumowania w czasie rzeczywistym, generowania kodu i wieloetapowej orkiestracji zadań z wykorzystaniem dużych modeli językowych (LLM) .
O ile GPU dominują w trenowaniu i dużym wnioskowaniu wsadowym, AI agentowe na dużą skalę tworzy inny wzorzec obliczeniowy: ciągłą pracę CPU o wysokiej przepustowości, przeplatającą wnioskowanie z logiką orkiestracji, z restrykcyjnymi budżetami opóźnień dla interakcji wieloetapowych. AWS argumentuje, że 33% niższe opóźnienia między rdzeniami, 5 razy większa pamięć cache i wysoka liczba rdzeni w instancji czynią Graviton5 idealnym wyborem dla tych obciążeń, gdy muszą działać w skali produkcyjnej bez ekonomicznych ograniczeń GPU .
Poza samą wydajnością, najistotniejszym technicznie dodatkiem do platformy Graviton5 jest Nitro Isolation Engine, nowy komponent systemu AWS Nitro szóstej generacji .
Zaimplementowany w języku Rust, Nitro Isolation Engine to minimalny, specjalnie zaprojektowany komponent hiperwizora, odpowiedzialny za egzekwowanie izolacji między maszynami wirtualnymi różnych najemców . To, co odróżnia go od każdego innego produkcyjnego hiperwizora, to formalna weryfikacja: AWS stworzył dowody sprawdzalne maszynowo za pomocą asystenta dowodzenia Isabelle, które matematycznie wykazują
:
W praktyce oznacza to, że AWS może dać matematyczną gwarancję, iż obciążenia jednego klienta nie mają dostępu do danych innego ani nie mogą zakłócać ich działania, a operatorzy AWS podlegają tym samym granicom izolacji . AWS zobowiązał się udostępnić implementację i dowody do wglądu klientów
.
Silnik jest domyślnie włączony na instancjach M9g . Stanowi to fundamentalną zmianę w gwarancji bezpieczeństwa chmury: przejście od kontroli operacyjnych i narracji audytowych do sprawdzalnych maszynowo gwarancji dotyczących warstwy izolacji.
Wymienieni z nazwy pierwsi użytkownicy i partnerzy testujący to m.in. Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian i ClickHouse, a także HubSpot i inne firmy .
Wyniki raportowane przez klientów obejmują wiele kategorii obciążeń:
Wyniki te odzwierciedlają schemat widoczny w całej krzywej adopcji Graviton: większość obciążeń odczuwa natychmiastową poprawę przy zerowych lub minimalnych zmianach kodu podczas migracji z x86 na ARM, a zyski te kumulują się między generacjami procesora .
Graviton5 zadebiutował w momencie, gdy serwerowe układy ARM przestały być tylko alternatywą dla optymalizacji kosztów, a stały się mainstreamowym wyborem wydajnościowym. W ciągu ostatnich trzech lat ponad połowa nowej mocy obliczeniowej AWS działała na Gravitonie, a 98% z 1000 największych klientów EC2 korzysta już z instancji Graviton .
Z monolityczną, 192-rdzeniową kością wykonaną w procesie 3 nm, obsługą PCIe Gen 6, pamięcią DDR5-8800 oraz dodatkiem formalnie zweryfikowanej izolacji, Graviton5 podnosi poprzeczkę nie tylko dla instancji AWS, ale i dla oczekiwań klientów wobec obliczeń w chmurze: wydajności, energooszczędności i bezpieczeństwa potwierdzonego matematycznym dowodem, a nie tylko obietnicą.
Ogólna dostępność M9g i M9gd oznacza, że te możliwości są teraz dostępne standardowymi ścieżkami adopcji EC2, a warianty zoptymalizowane obliczeniowo (C9g) i pamięciowo (R9g) są już zapowiedziane .
Comments
0 comments