Overgangen fra dual-socket Graviton4 til en monolittisk Graviton5-brikke fjerner all kommunikasjonstid mellom sokler. For arbeidsbelastninger som sprer seg over mange kjerner – sanntidsinferens, databaser i minnet, eller store mikrotjenesteflåter – kan latensreduksjonen alene gi målbare gevinster i gjennomstrømming, selv før man ser på forbedringer i instruksjonshåndtering.
AWS sine publiserte generasjonsforbedringer er konsistente på tvers av offisielle kilder, tredjepartsanalyser og tidlige kundemålinger:
Datakraft og gjennomstrømming:
I/U og båndbredde:
Reelle kunderesultater:
Tallene samsvarer med de arkitektoniske endringene. Den 5× større L3-cachen reduserer kostbare DRAM-oppslag, spesielt for database- og analysejobber med store datasett. Raskere DDR5-8800-minne og PCIe Gen 6 I/U fjerner flaskehalser som begrenset gjennomstrømming i tidligere generasjoner. Og overgangen til ett enkelt sokkel-design senker «latenstollen» som skalerte applikasjoner betaler på NUMA-arkitekturer.
For arbeidsbelastninger som trenger høyhastighets, flyktig lagring direkte koblet til instansen, tilbyr AWS M9gd-varianten. Disse bygger videre på Graviton5-plattformen med lokal, NVMe-basert SSD-blokklagring. De tilbyr opptil 11,4 TB lokal NVMe SSD-kapasitet med 30 % høyere IOPS enn forrige generasjons lokale lagring .
M9gd er spesielt rettet mot massive cache-flåter, loggprosesseringspipelines og sanntidsanalyse, der det å holde data så nær CPU-en som mulig direkte påvirker spørrelatens og gjennomstrømming. Kombinasjonen av raskere kjerner, lavere intern latens og høyere lokal IOPS gjør M9gd til et naturlig valg for alle jobber som tjener på å kollapse avstanden mellom lagring og prosessering.
Et markant skifte med Graviton5 er AWS sin tydelige satsing på agentic AI-arbeidsbelastninger – systemer som utfører sanntidsresonnement, kodegenerering og orkestrering av flertrinnsoppgaver ved hjelp av store språkmodeller og annen generativ AI .
Mens GPU- og akseleratorinstanser dominerer for trening og stor batch-inferens, skaper agentic AI i skala et annet datamønster: kontinuerlig CPU-arbeid med høy gjennomstrømming som veksler mellom inferenssteg og orkestreringslogikk, med stramme latenstidsrammer for flertrinns interaksjoner. AWS argumenterer for at Graviton5s 33 % lavere interne latens, 5× større cache og høye kjernetall gjør den godt egnet for disse jobbene når de skal kjøres i produksjonsskala uten GPU-kostnader .
Utover rå ytelse er den mest teknisk betydningsfulle nyvinningen i Graviton5-plattformen Nitro Isolation Engine, en ny komponent i den sjette generasjonen av AWS Nitro System .
Implementert i programmeringsspråket Rust, er Nitro Isolation Engine en minimal, spesialbygd hypervisorkomponent som håndhever isolasjon mellom virtuelle maskiner . Det som skiller den fra alle andre produksjonshypervisorer er formell verifikasjon: AWS har utarbeidet maskinverifiserbare bevis ved hjelp av Isabelle-bevisassistenten som matematisk demonstrerer
:
Praktisk talt betyr dette at AWS kan gi en matematisk sikkerhet for at én kundes arbeidsbelastning ikke får tilgang til en annens data eller forstyrrer kjøringen deres, og at AWS-ansatte er underlagt de samme isolasjonsgrensene . AWS har forpliktet seg til å gjøre implementasjonen og bevisene for Nitro Isolation Engine tilgjengelig for kundeinnsyn
.
Motoren er aktivert som standard på M9g-instanser . Dette markerer et paradigmeskifte for sikkerhetsgarantier i skyen: fra operative kontroller og revisjonsfortellinger, til maskinverifiserbare garantier om det grunnleggende isolasjonslaget.
Navngitte tidlige brukere og testpartnere inkluderer Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian og ClickHouse, samt HubSpot og flere identifisert gjennom offentliggjøring av ytelsesdata .
Kunderapporterte resultater spenner over flere kategorier:
Disse resultatene speiler mønstre i adopsjonskurven for Graviton: de fleste arbeidsbelastninger ser umiddelbare ytelsesforbedringer med null eller minimale kodeendringer når man migrerer fra x86 til ARM, og gevinstene akkumuleres med hver generasjon .
Graviton5 kommer på et tidspunkt der ARM-basert serverprosessor har gått fra å være et kostnadsalternativ til et vanlig ytelsesvalg. Mer enn halvparten av ny AWS CPU-kapasitet har kjørt på Graviton i tre år, og 98 % av de 1 000 største EC2-kundene bruker allerede Graviton-instanser .
Med en monolittisk 192-kjerners brikke på 3nm-prosess, PCIe Gen 6-støtte, DDR5-8800-minne, og tillegget av formelt verifisert isolasjon, hever Graviton5 standarden for hva kunder kan forvente av skybasert datakraft: ytelse, energieffektivitet og sikkerhetsgarantier understøttet av matematiske bevis, snarere enn operasjonelle løfter.
At M9g og M9gd nå er generelt tilgjengelig betyr at disse egenskapene er innen rekkevidde gjennom standard adopsjonsprosesser i EC2. Beregningsoptimaliserte C9g- og minneoptimaliserte R9g-varianter forventes å følge .
Comments
0 comments