Přechod z dvousocketového návrhu Graviton4 na monolitický čip Graviton5 zcela odstraňuje režii spojenou s komunikací mezi sockety. Pro pracovní zátěže, které se rozprostírají na mnoha jádrech – jako jsou pipeline pro real-time inferenci, in-memory databáze nebo rozsáhlé flotily mikroslužeb – může samotné snížení latence přinést měřitelný nárůst propustnosti ještě před započtením jakýchkoli architektonických vylepšení.
Generační zlepšení uváděná AWS jsou konzistentní napříč oficiálními zdroji, analýzami třetích stran i prvními zákaznickými benchmarky:
Výpočetní výkon a propustnost:
I/O a propustnost:
Reálné výsledky zákazníků:
Tato čísla odpovídají architektonickým změnám. Pětkrát větší L3 cache snižuje nákladné přístupy do operační paměti DRAM, zejména u databázových a analytických zátěží, které procházejí velké objemy dat. Rychlejší paměti DDR5-8800 a PCIe Gen 6 I/O odstraňují úzká hrdla v propustnosti, která v předchozích generacích omezovala výkon. A přechod na jednočipový návrh snižuje daň za latenci, kterou škálovatelné aplikace platí na architekturách NUMA.
Pro zátěže, které vyžadují vysokorychlostní dočasné úložiště přímo připojené k instanci, nabízí AWS variantu M9gd. Tyto instance přidávají lokální blokové úložiště na bázi NVMe SSD na stejnou výpočetní platformu Graviton5 a poskytují až 11,4 TB kapacity lokálního NVMe SSD s o 30 % vyšším IOPS (vstupně-výstupní operace za sekundu) než lokální úložiště předchozí generace .
Varianta M9gd cílí na zátěže, jako jsou rozsáhlé cacheovací farmy, pipeline pro zpracování logů a real-time analytické nástroje, kde udržení dat co nejblíže CPU přímo ovlivňuje latenci dotazů a propustnost. Kombinace rychlejších jader, nižší mezijádrové latence a vyššího IOPS lokálního úložiště činí z M9gd přirozenou volbu pro jakoukoli zátěž, která těží ze zmenšení propasti mezi úložištěm a výpočtem.
Jedním z výraznějších posunů v komunikaci ohledně Graviton5 je výslovné zacílení AWS na pracovní zátěže agentní AI – systémy, které provádějí uvažování v reálném čase, generování kódu a orchestraci vícestupňových úloh s využitím velkých jazykových modelů a dalších technik generativní AI .
Zatímco v oblasti trénování a velkodávkové inference dominují GPU a akcelerátorové instance, agentní AI ve velkém měřítku vytváří odlišný výpočetní vzorec: kontinuální práci CPU s vysokou propustností, která se střídá mezi kroky modelové inference a orchestrací, s přísnými limity latence pro vícekolové interakce. AWS argumentuje, že o 33 % nižší mezijádrová latence Gravitonu5, 5× větší mezipaměť a vysoký počet jader na instanci jej činí ideálním pro tyto zátěže, když je třeba je provozovat v produkčním měřítku bez ekonomiky GPU .
Kromě hrubého výkonu je technicky nejvýznamnějším přírůstkem platformy Graviton5 Nitro Isolation Engine, nová součást systému AWS Nitro šesté generace .
Implementován v jazyce Rust, Nitro Isolation Engine je minimální, účelově vytvořená komponenta hypervisoru zodpovědná za prosazování izolace mezi spolunajímanými virtuálními stroji . To, co jej odlišuje od všech ostatních produkčních hypervizorů, je formální verifikace: AWS vytvořila strojově kontrolovatelné důkazy pomocí asistenta pro důkazy Isabelle, které matematicky prokazují
:
V praxi to znamená, že AWS může poskytnout matematickou jistotu, že pracovní zátěže jednoho zákazníka nemohou přistupovat k datům jiného zákazníka nebo narušovat jejich provádění a že operátoři AWS podléhají stejným izolačním hranicím . AWS se zavázala zpřístupnit implementaci Nitro Isolation Engine a odpovídající důkazy k nahlédnutí zákazníkům
.
Tento engine je standardně povolen na instancích M9g . Představuje to posun v zajištění cloudové bezpečnosti: od provozních kontrol a auditních narativů směrem ke strojově kontrolovatelným zárukám o základní izolační vrstvě.
Mezi jmenované první uživatele a partnery pro benchmarky patří Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian a ClickHouse, spolu s HubSpot a dalšími identifikovanými prostřednictvím zveřejněných údajů o výkonu .
Zákazníky hlášené výsledky pokrývají několik kategorií pracovních zátěží:
Tyto výsledky odrážejí vzorce viditelné napříč křivkou adopce Gravitonu: většina pracovních zátěží zaznamená okamžité zlepšení výkonu s nulovými nebo minimálními změnami kódu při migraci z x86 na ARM a zisky se kumulují napříč generacemi, jak se křemík zlepšuje .
Graviton5 přichází v okamžiku, kdy se ARMový serverový křemík přesunul z alternativy pro optimalizaci nákladů na mainstreamovou výkonnostní volbu. Více než polovina nové výpočetní kapacity AWS běží v posledních třech letech na Gravitonech a 98 % z 1 000 největších zákazníků EC2 již instance založené na Gravitonu používá .
S monolitickým 192jádrovým čipem na 3nm procesu, podporou PCIe Gen 6, pamětí DDR5-8800 a přidáním formálně ověřené izolace pracovních zátěží zvyšuje Graviton5 laťku nejen pro vlastní rodiny instancí AWS, ale i pro to, co mohou zákazníci rozumně očekávat od cloud-native computingu: výkon, energetickou účinnost a bezpečnostní záruky podložené matematickým důkazem namísto provozních slibů.
Obecná dostupnost instancí M9g a M9gd znamená, že tyto schopnosti jsou nyní přístupné prostřednictvím standardních adopčních cest EC2, přičemž se očekává, že budou následovat výpočetně optimalizované varianty C9g a paměťově optimalizované varianty R9g .
Comments
0 comments