De overstap van een dual-socket Graviton4-ontwerp naar een monolithische Graviton5-chip elimineert de overhead van communicatie tussen sockets volledig. Voor workloads die zich over vele cores verspreiden, zoals real-time inferentiepijplijnen, in-memory databases of grootschalige microservicevloten, kan de latentievermindering alleen al meetbare doorvoerwinst opleveren, nog voordat eventuele IPC-verbeteringen (Instructions Per Clock) worden meegerekend.
De door AWS gepubliceerde generatiewinsten zijn consistent in officiële bronnen, analyses van derden en benchmarks van vroege klanten:
Rekenkracht en doorvoer:
I/O en bandbreedte:
Praktijkresultaten van klanten:
Deze cijfers komen overeen met de architectonische veranderingen. De 5× grotere L3-cache vermindert kostbare DRAM-toegangen, vooral voor database- en analyticsworkloads die grote werksets doorlopen. Het snellere DDR5-8800-geheugen en de PCIe Gen 6 I/O elimineren bandbreedteknelpunten die de doorvoer in vorige generaties beperkten. En de verhuizing naar een single-socket ontwerp vermindert de latentiebelasting die uitgeschaalde applicaties ondervinden op NUMA-architecturen.
Voor workloads die snelle, tijdelijke opslag direct aan de instantie gekoppeld nodig hebben, biedt AWS de M9gd-variant. Deze instanties combineren lokale NVMe-gebaseerde SSD-blokopslag met hetzelfde Graviton5-rekenplatform. Ze bieden tot 11,4 TB aan lokale NVMe SSD-capaciteit met 30% hogere IOPS dan het lokale opslagaanbod van de vorige generatie .
De M9gd-variant richt zich op workloads zoals grootschalige cachingvloten, logverwerkingspijplijnen en real-time analytics-engines waarbij het dicht bij de CPU houden van data direct invloed heeft op querylatentie en -doorvoer. De combinatie van snellere cores, lagere inter-core latentie en hogere lokale opslag-IOPS maakt de M9gd een logische keuze voor elke workload die baat heeft bij het verkleinen van de kloof tussen opslag en rekenkracht.
Een opvallende positioneringsverschuiving met Graviton5 is dat AWS zich expliciet richt op agentische AI-workloads. Dit zijn systemen die real-time redeneren, code genereren en meertraps-taakorkestratie uitvoeren met behulp van grote taalmodellen en andere generatieve AI-technieken .
Hoewel GPU- en acceleratorinstanties het gesprek over training en grootschalige batch-inferentie domineren, creëert agentische AI op schaal een ander rekenpatroon: continu CPU-werk met hoge doorvoer dat modelinferentiestappen afwisselt met orkestratielogica, met strikte latentiebudgetten voor multi-turn interacties. AWS stelt dat Graviton5's 33% lagere inter-core latentie, 5× grotere cache en hoge aantal cores per instantie het zeer geschikt maken voor zulke workloads wanneer ze op productieschaal moeten draaien zonder de economische voorwaarden van GPU's .
Naast pure prestaties is de technisch meest significante toevoeging aan het Graviton5-platform de Nitro Isolation Engine, een nieuw onderdeel van het zesde-generatie AWS Nitro-systeem .
Geïmplementeerd in Rust, is de Nitro Isolation Engine een minimale, speciaal gebouwde hypervisorcomponent die verantwoordelijk is voor het afdwingen van isolatie tussen virtuele machines van verschillende huurders . Wat het onderscheidt van elke andere productie-hypervisor is formele verificatie: AWS heeft machinecontroleerbare bewijzen geproduceerd met behulp van de Isabelle-bewijsassistent die wiskundig het volgende aantonen
:
In de praktijk betekent dit dat AWS wiskundige zekerheid kan bieden dat de werklasten van de ene klant geen toegang hebben tot de data van een andere klant of hun uitvoering kunnen verstoren, en dat AWS-operators aan dezelfde isolatiegrenzen onderhevig zijn . AWS heeft toegezegd de implementatie van de Nitro Isolation Engine en de bijbehorende bewijzen beschikbaar te stellen voor klantbeoordeling
.
De engine is standaard ingeschakeld op M9g-instanties . Dit vertegenwoordigt een verschuiving in cloudbeveiligingsgaranties: van operationele controles en auditverhalen naar machinecontroleerbare garanties over de fundamentele isolatielaag.
Genoemde vroege gebruikers en benchmarkpartners zijn onder meer Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian en ClickHouse, samen met HubSpot en anderen die zijn geïdentificeerd via openbaarmakingen van prestatiedata .
Door klanten gerapporteerde resultaten bestrijken meerdere workloadcategorieën:
Deze resultaten weerspiegelen patronen die zichtbaar zijn in de gehele Graviton-adoptiecurve: de meeste workloads zien onmiddellijke prestatieverbeteringen zonder of met minimale codewijzigingen bij migratie van x86 naar Arm, en de winst stapelt zich op over generaties naarmate het silicium verbetert .
Graviton5 arriveert op een moment dat Arm-gebaseerde serversilicium is geëvolueerd van een kostenoptimalisatie-alternatief naar een mainstream prestatiekeuze. Meer dan de helft van de nieuwe AWS CPU-capaciteit draait al drie jaar op Graviton, en 98% van de top 1.000 EC2-klanten gebruikt al Graviton-gebaseerde instanties .
Met een monolithische 192-core chip op een 3nm-procedé, PCIe Gen 6-ondersteuning, DDR5-8800-geheugen en de toevoeging van wiskundig geverifieerde werklastisolatie, verhoogt Graviton5 de lat niet alleen voor de eigen instantiefamilies van AWS, maar ook voor wat klanten redelijkerwijs mogen verwachten van cloud-native rekenkracht: prestaties, energie-efficiëntie en beveiligingsgaranties die worden ondersteund door wiskundig bewijs in plaats van operationele beloften.
De algemene beschikbaarheid van M9g- en M9gd-instanties betekent dat deze mogelijkheden nu toegankelijk zijn via standaard EC2-adoptiepaden, terwijl de rekenkracht-geoptimaliseerde C9g- en geheugen-geoptimaliseerde R9g-varianten naar verwachting later zullen volgen .
Comments
0 comments