Der Wechsel vom Dual-Socket-Design des Graviton4 zum monolithischen Graviton5-Die eliminiert die Kommunikationsverluste zwischen den Sockeln vollständig. Für Workloads, die sich über viele Kerne erstrecken – wie Echtzeit-Inferenz-Pipelines, In-Memory-Datenbanken oder große Microservice-Flotten – kann die reine Latenzreduktion bereits zu messbaren Durchsatzgewinnen führen, noch bevor IPC-Verbesserungen (Instruktionen pro Taktzyklus) berücksichtigt werden.
Die von AWS veröffentlichten Generationsverbesserungen werden durch offizielle Quellen, unabhängige Analysen und frühe Kunden-Benchmarks einheitlich bestätigt:
Rechenleistung und Durchsatz:
I/O und Bandbreite:
Ergebnisse aus der Praxis:
Diese Zahlen decken sich mit den architektonischen Änderungen. Der fünffach größere L3-Cache minimiert kostspielige DRAM-Zugriffe, insbesondere bei Datenbank- und Analyse-Workloads, die große Datensätze durchlaufen. Der schnellere DDR5-8800-Arbeitsspeicher und PCIe Gen 6 I/O beseitigen Bandbreiten-Engpässe, die den Durchsatz in vorherigen Generationen deckelten. Und die Umstellung auf ein Single-Socket-Design reduziert die Latenzbelastung, die skalierte Anwendungen in NUMA-Architekturen erfahren.
Für Workloads, die einen schnellen, flüchtigen Speicher direkt an der Instanz benötigen, bietet AWS die M9gd-Variante an. Diese Instanzen kombinieren lokalen NVMe-basierten SSD-Block-Speicher mit der gleichen Graviton5-Rechenplattform und bieten bis zu 11,4 TB lokale NVMe SSD-Kapazität mit 30 % höheren IOPS als das lokale Speicherangebot der Vorgängergeneration .
Die M9gd-Variante zielt auf Workloads wie große Caching-Flotten, Log-Verarbeitungs-Pipelines und Echtzeit-Analyse-Engines ab, bei denen die Nähe der Daten zur CPU einen direkten Einfluss auf Abfragelatenz und Durchsatz hat. Die Kombination aus schnelleren Kernen, geringerer Inter-Core-Latenz und höheren IOPS des lokalen Speichers macht M9gd zu einer natürlichen Wahl für jeden Workload, der davon profitiert, die Distanz zwischen Speicher und Rechenleistung zu minimieren.
Eine der bemerkenswertesten Verschiebungen in der Positionierung von Graviton5 ist die explizite Ausrichtung von AWS auf agentische KI-Workloads – Systeme, die Echtzeit-Argumentation, Code-Generierung und mehrstufige Aufgabenorchestrierung mithilfe von großen Sprachmodellen und anderen generativen KI-Techniken durchführen .
Während GPU- und Beschleuniger-Instanzen den Diskurs über das Training und die Inferenz großer Batches dominieren, erzeugt agentische KI im großen Maßstab ein anderes Rechenmuster: kontinuierliche Hochdurchsatz-CPU-Arbeit, die zwischen Modellinferenz-Schritten und Orchestrierungslogik wechselt, mit strikten Latenzvorgaben für mehrstufige Interaktionen. AWS argumentiert, dass die um 33 % geringere Inter-Core-Latenz von Graviton5, der 5-mal größere Cache und die hohe Kernanzahl pro Instanz diesen Prozessor für solche Workloads prädestinieren, wenn sie im Produktionsmaßstab ohne GPU-Ökonomie betrieben werden sollen .
Abseits der reinen Leistungsdaten ist die technisch bedeutendste Ergänzung der Graviton5-Plattform die Nitro Isolation Engine, eine neue Komponente des AWS Nitro Systems der sechsten Generation .
Die in Rust implementierte Nitro Isolation Engine ist eine minimale, zweckgebaute Hypervisor-Komponente, die für die Durchsetzung der Isolation zwischen gemeinsam genutzten virtuellen Maschinen verantwortlich ist . Was sie von jedem anderen Produktions-Hypervisor unterscheidet, ist die formale Verifikation: AWS hat maschinell prüfbare Beweise mithilfe des Isabelle-Beweisassistenten erstellt, die mathematisch Folgendes demonstrieren
:
Praktisch bedeutet dies, dass AWS die mathematische Gewissheit liefern kann, dass die Workloads eines Kunden nicht auf die Daten eines anderen zugreifen oder deren Ausführung beeinträchtigen können und dass AWS-Operatoren denselben Isolationsgrenzen unterliegen . AWS hat sich verpflichtet, die Implementierung und die zugehörigen Beweise der Nitro Isolation Engine für Kunden zur Überprüfung zugänglich zu machen
.
Die Engine ist standardmäßig auf M9g-Instanzen aktiviert . Dies stellt einen Wandel in der Cloud-Sicherheitszusicherung dar: von operativen Kontrollen und Audit-Beschreibungen hin zu maschinell prüfbaren Garantien über die grundlegende Isolationsschicht.
Namentlich genannte Frühanwender und Benchmark-Partner umfassen Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian und ClickHouse, neben weiteren wie HubSpot, die durch die Offenlegung von Leistungsdaten identifiziert wurden .
Die von Kunden berichteten Ergebnisse decken mehrere Workload-Kategorien ab:
Diese Ergebnisse spiegeln sichtbare Muster in der Graviton-Adoptionskurve wider: Die meisten Workloads zeigen sofortige Leistungsverbesserungen ohne oder mit nur minimalen Codeänderungen beim Wechsel von x86 zu Arm, und die Gewinne summieren sich von Generation zu Generation, wenn das Silizium besser wird .
Graviton5 kommt zu einem Zeitpunkt, an dem sich Arm-basiertes Server-Silizium von einer Kostenoptimierungsalternative zu einer Mainstream-Performance-Wahl entwickelt hat. Mehr als die Hälfte der neuen AWS-CPU-Kapazität lief in den letzten drei Jahren auf Graviton, und 98 % der Top-1.000-EC2-Kunden nutzen bereits Graviton-basierte Instanzen .
Mit einem monolithischen 192-Kern-Die in einem 3nm-Prozess, PCIe Gen 6-Unterstützung, DDR5-8800-Arbeitsspeicher und der Hinzufügung einer formal verifizierten Workload-Isolation hebt Graviton5 die Messlatte nicht nur für die eigenen Instanzfamilien von AWS, sondern auch für das, was Kunden vernünftigerweise von Cloud-nativem Computing erwarten können: Leistung, Energieeffizienz und Sicherheitsgarantien, die durch mathematische Beweise und nicht durch operative Versprechungen abgesichert sind.
Die allgemeine Verfügbarkeit der M9g- und M9gd-Instanzen bedeutet, dass diese Fähigkeiten nun über die standardmäßigen EC2-Adoptionspfade zugänglich sind. Die rechenoptimierten C9g- und arbeitsspeicheroptimierten R9g-Varianten werden voraussichtlich folgen .
Comments
0 comments