Att gå från en dubbelsocklad Graviton4-design till ett monolitiskt Graviton5-chip eliminerar all kommunikations-overhead mellan socklar. För arbetslaster som sprids över många kärnor – realtidsinferens-pipelines, in memory-databaser eller storskaliga mikrotjänstflottor – kan latensminskningen ensam ge mätbara genomströmningsvinster innan man ens räknar in IPC-förbättringar.
AWS publicerade generationsförbättringar är konsekventa över officiella källor, tredjepartsanalyser och tidiga kundbenchmark:
Beräkning och genomströmning:
I/O och bandbredd:
Resultat från verkliga kunder:
Dessa siffror stämmer väl överens med de arkitektoniska förändringarna. Den 5× större L3-cachen minskar kostsamma DRAM-åtkomster, särskilt för databas- och analysarbetslaster som traverserar stora arbetsminnen. Det snabbare DDR5-8800-minnet och PCIe Gen 6 I/O tar bort bandbreddsflaskhalsar som tidigare begränsade genomströmningen. Och övergången till en enda sockel-design minskar den latensskatt som skalbara applikationer betalar på NUMA-arkitekturer.
För arbetslaster som behöver snabb, tillfällig lagring direkt ansluten till instansen erbjuder AWS M9gd-varianten. Dessa instanser lägger till lokal NVMe-baserad SSD-blocklagring ovanpå samma Graviton5-beräkningsplattform, och erbjuder upp till 11,4 TB lokal NVMe SSD-kapacitet med 30% högre IOPS än föregående generations lokala lagringserbjudande .
M9gd-varianten riktar sig till arbetslaster som storskaliga caching-flottor, logghanterings-pipelines och realtidsanalys-motorer där det att hålla data så nära processorn som möjligt direkt påverkar frågelatens och genomströmning. Kombinationen av snabbare kärnor, lägre latens mellan kärnor och högre lokal lagrings-IOPS gör M9gd till ett naturligt val för alla arbetslaster som drar nytta av att minska avståndet mellan lagring och beräkning.
Ett av de mer anmärkningsvärda positionsskiftena med Graviton5 är AWS uttryckliga inriktning mot agentiska AI-arbetslaster – system som utför realtidsresonemang, kodgenerering och flerstegs-orkestrering av uppgifter med hjälp av stora språkmodeller och andra generativa AI-tekniker .
Även om GPU- och acceleratorinstanser dominerar diskussionen om träning och storskalig batch-inferens, skapar agentisk AI i stor skala ett annat beräkningsmönster: kontinuerligt CPU-arbete med hög genomströmning som växlar mellan modellinferenssteg och orkestreringslogik, med strikta latensbudgetar för interaktioner med flera turer. AWS argumenterar för att Graviton5:s 33% lägre latens mellan kärnor, 5× större cache och höga kärnantal per instans gör den väl lämpad för dessa arbetslaster när de behöver köras i produktionsskala utan GPU-ekonomins kostnader .
Utöver ren prestanda är det mest tekniskt betydelsefulla tillägget till Graviton5-plattformen Nitro Isolation Engine, en ny komponent i sjätte generationens AWS Nitro System .
Implementerad i Rust är Nitro Isolation Engine en minimal, specialbyggd hypervisorkomponent som ansvarar för att upprätthålla isolering mellan virtuella maskiner på samma hårdvara . Vad som skiljer den från varje annan produktionshypervisor är formell verifiering: AWS har tagit fram maskinkontrollerbara bevis med hjälp av Isabelle-bevisassistenten som matematiskt demonstrerar
:
I praktiken innebär detta att AWS kan tillhandahålla matematisk säkerhet för att en kunds arbetslaster inte kan komma åt en annans data eller störa deras exekvering, och att AWS operatörer omfattas av samma isoleringsgränser . AWS har åtagit sig att göra Nitro Isolation Engines implementation och motsvarande bevis tillgängliga för kundgranskning
.
Motorn är aktiverad som standard på M9g-instanser . Detta representerar ett skifte i molnsäkerhetsgarantier: från operativa kontroller och revisionsberättelser till maskinkontrollerbara garantier om det grundläggande isoleringslagret.
Namngivna tidiga användare och benchmark-partners inkluderar Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian och ClickHouse, tillsammans med HubSpot och andra identifierade genom prestandadata .
Kundrapporterade resultat spänner över flera arbetslastkategorier:
Dessa resultat speglar mönster som är synliga över Graviton-adoptionskurvan: de flesta arbetslaster ser omedelbara prestandaförbättringar med noll eller minimala kodändringar när man migrerar från x86 till Arm, och vinsterna ackumuleras över generationer i takt med att kiseldesignen förbättras .
Graviton5 anländer i ett ögonblick då Arm-baserat serverkisel har gått från att vara ett kostnadsoptimeringsalternativ till ett vanligt prestandaval. Mer än hälften av all ny AWS CPU-kapacitet har körts på Graviton under de senaste tre åren, och 98% av de 1 000 största EC2-kunderna använder redan Graviton-baserade instanser .
Med ett monolitiskt 192-kärnigt chip på en 3nm-process, PCIe Gen 6-stöd, DDR5-8800-minne och tillägget av formellt verifierad arbetslastsisolering, höjer Graviton5 ribban inte bara för AWS egna instansfamiljer utan för vad kunder rimligen kan förvänta sig av molnbaserad beräkning: prestanda, energieffektivitet och säkerhetsgarantier som backas upp av matematiska bevis snarare än operativa löften.
Den allmänna tillgängligheten av M9g- och M9gd-instanser innebär att dessa kapaciteter nu är tillgängliga via standard EC2-adoptionsvägar, med beräkningsoptimerade C9g- och minnesoptimerade R9g-varianter som förväntas följa .
Comments
0 comments