Overgangen fra et dual-socket Graviton4-design til en monolitisk Graviton5-chip fjerner al overhead ved kommunikation mellem sockets. For arbejdsbelastninger, der spredes over mange kerner – realtidsinferens, in-memory databaser eller store mikrotjenesteflåder – kan reduktionen i latenstid alene give målbare gennemløbsgevinster, før man overhovedet medregner IPC-forbedringer.
AWS' offentliggjorte generationsforbedringer er konsistente på tværs af officielle kilder, tredjepartsanalyser og tidlige kundetests:
Beregning og gennemløb:
I/O og båndbredde:
Resultater fra virkelige kunder:
Disse tal stemmer overens med de arkitektoniske ændringer. Den 5× større L3-cache reducerer kostbar DRAM-adgang, især for database- og analysearbejdsbelastninger, der gennemløber store datasæt. Den hurtigere DDR5-8800-hukommelse og PCIe Gen 6 I/O fjerner båndbreddeflaskehalse, der tidligere satte en dæmper på gennemløbet. Og skiftet til et single-socket design eliminerer den latenstidsskat, som skalérbare applikationer betaler på NUMA-arkitekturer.
Til arbejdsbelastninger, der har brug for hurtig, midlertidig lagring direkte tilknyttet instansen, tilbyder AWS M9gd-varianten. Disse instanser tilføjer lokal NVMe-baseret SSD-lagring oven på den samme Graviton5-beregningsplatform, og leverer op til 11,4 TB lokal NVMe SSD-kapacitet med 30% højere IOPS end den foregående generation .
M9gd-varianten er målrettet arbejdsbelastninger som storskala caching, logbehandlingspipelines og realtidsanalyse, hvor afstanden mellem data og CPU direkte påvirker forespørgselstid. Kombinationen af hurtigere kerner, lavere intern latenstid og højere lokal IOPS gør M9gd til et naturligt valg til alt, der nyder godt af at kollapse afstanden mellem lagring og beregning.
Et af de mere bemærkelsesværdige positioneringsskift med Graviton5 er AWS' eksplicitte målretning mod agentic AI-arbejdsbelastninger – systemer, der udfører avanceret ræsonnering, kodegenerering og flertrinsopgaveorkestrering ved hjælp af store sprogmodeller og anden generativ AI .
Mens GPU- og acceleratorinstanser dominerer samtalen om træning og inferens i store batches, skaber agentic AI i skala et anderledes beregningsmønster: kontinuerligt, højt CPU-gennemløb, der veksler mellem modelinferens og orkestreringslogik, med stramme latenstidsbudgetter for flertrinsinteraktioner. AWS argumenterer for, at Graviton5's 33% lavere inter-core latenstid, 5× større cache og høje kernetal gør den særdeles velegnet til netop disse workloads, når de skal køre i produktionsskala uden at påtage sig GPU'ernes økonomi .
Udover den rå ydelse er den mest teknisk betydningsfulde tilføjelse til Graviton5-platformen Nitro Isolation Engine, en ny komponent i sjette generation af AWS Nitro System .
Implementeret i Rust er Nitro Isolation Engine en minimal, formålsbygget hypervisorkomponent, der er ansvarlig for at håndhæve isolation mellem virtuelle maskiner, der deler hardware . Hvad der adskiller den fra alle andre produktionshypervisorer, er formel verificering: AWS har fremstillet maskincheckbare beviser ved hjælp af Isabelle bevisassistenten, som matematisk demonstrerer
:
I praksis betyder det, at AWS kan give matematisk vished for, at en kundes arbejdsbelastning ikke kan tilgå en andens data eller forstyrre deres eksekvering, og at AWS-operatører er underlagt de samme isolationsgrænser . AWS har forpligtet sig til at gøre Nitro Isolation Engines implementering og tilsvarende beviser tilgængelige, så kunder kan gennemgå dem
.
Motoren er aktiveret som standard på M9g-instanser . Dette repræsenterer et skift inden for cloud-sikkerhed: fra operationelle kontroller og revisionsfortællinger til maskincheckbare garantier om det fundamentale isolationslag.
Blandt de navngivne tidlige brugere og benchmarkpartnere finder vi Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian og ClickHouse samt HubSpot og andre identificeret gennem offentliggjorte ydelsesdata .
Kunderapporterede resultater spænder over flere kategorier:
Disse resultater afspejler mønstre, der er synlige på tværs af Graviton-adoptionskurven: De fleste arbejdsbelastninger ser umiddelbare ydelsesforbedringer med nul eller minimale kodeændringer, når de migrerer fra x86 til Arm, og gevinsterne vokser med hver chipgeneration .
Graviton5 ankommer på et tidspunkt, hvor Arm-baseret server-silicium er gået fra at være et omkostningsoptimeringsalternativ til et mainstream valg for ydelse. Mere end halvdelen af AWS' nye CPU-kapacitet har de sidste tre år kørt på Graviton, og 98% af de 1.000 største EC2-kunder bruger allerede Graviton-baserede instanser .
Med en monolitisk 192-kernet chip i 3nm, understøttelse af PCIe Gen 6, DDR5-8800-hukommelse og tilføjelsen af formelt verificeret isolering, hæver Graviton5 barren – ikke kun for AWS’ egne instansfamilier, men for hvad kunder med rimelighed kan forvente af cloud-native beregning: ydelse, energieffektivitet og sikkerhedsgarantier, der er bakket op af matematiske beviser frem for operationelle løfter.
Den generelle tilgængelighed af M9g og M9gd betyder, at disse muligheder nu er tilgængelige via standard EC2-adoptionsveje, og der forventes at følge beregningsoptimeringsorienterede C9g- og hukommelsesoptimerede R9g-varianter i den nærmeste fremtid .
Comments
0 comments