Bergeser dari desain dual-socket Graviton4 ke die monolitik Graviton5 menghilangkan overhead komunikasi lintas soket sepenuhnya. Untuk beban kerja yang tersebar di banyak core—seperti pipeline inferensi real-time, database dalam memori, atau armada layanan mikro skala besar—pengurangan latensi ini saja dapat menghasilkan peningkatan throughput yang terukur bahkan sebelum mempertimbangkan peningkatan IPC (Instructions Per Cycle).
Peningkatan generasi yang dipublikasikan AWS konsisten di seluruh sumber resmi, analisis pihak ketiga, dan tolok ukur pelanggan awal:
Komputasi dan throughput:
I/O dan bandwidth:
Hasil nyata pelanggan:
Angka-angka ini selaras dengan perubahan arsitektur. Cache L3 yang 5× lebih besar mengurangi akses DRAM yang mahal, terutama untuk beban kerja database dan analitik yang melintasi set data kerja besar. Memori DDR5-8800 yang lebih cepat dan I/O PCIe Gen 6 menghilangkan hambatan bandwidth yang membatasi throughput pada generasi sebelumnya. Dan pergeseran ke desain soket tunggal mengurangi pajak latensi yang harus dibayar aplikasi skala luas pada arsitektur NUMA (Non-Uniform Memory Access).
Untuk beban kerja yang membutuhkan penyimpanan ephemeral berkecepatan tinggi yang terpasang langsung ke instans, AWS menawarkan varian M9gd. Instans ini menambahkan penyimpanan blok berbasis NVMe SSD lokal di atas platform komputasi Graviton5 yang sama, menyediakan hingga 11,4 TB kapasitas NVMe SSD lokal dengan IOPS 30% lebih tinggi dari penawaran penyimpanan lokal generasi sebelumnya .
Varian M9gd menargetkan beban kerja seperti armada caching skala besar, pipeline pemrosesan log, dan mesin analitik real-time di mana menjaga data sedekat mungkin dengan CPU secara langsung memengaruhi latensi kueri dan throughput. Kombinasi core yang lebih cepat, latensi antar-core yang lebih rendah, dan IOPS penyimpanan lokal yang lebih tinggi menjadikan M9gd pilihan alami untuk beban kerja apa pun yang mendapat manfaat dari menutup jarak antara penyimpanan dan komputasi.
Salah satu pergeseran posisi yang lebih menonjol dengan Graviton5 adalah penargetan eksplisit AWS terhadap beban kerja AI agentik—sistem yang melakukan penalaran real-time, generasi kode, dan orkestrasi tugas multi-langkah menggunakan model bahasa besar dan teknik AI generatif lainnya .
Sementara instans GPU dan akselerator mendominasi percakapan seputar pelatihan dan inferensi batch besar, AI agentik dalam skala besar menciptakan pola komputasi yang berbeda: pekerjaan CPU throughput tinggi berkelanjutan yang bergantian antara langkah-langkah inferensi model dan logika orkestrasi, dengan anggaran latensi ketat untuk interaksi multi-putaran. AWS berargumen bahwa latensi antar-core Graviton5 yang 33% lebih rendah, cache 5× lebih besar, dan jumlah core tinggi per instans membuatnya sangat cocok untuk beban kerja ini ketika perlu dijalankan pada skala produksi tanpa keekonomian GPU .
Di luar performa mentah, tambahan paling signifikan secara teknis pada platform Graviton5 adalah Nitro Isolation Engine, komponen baru dari Sistem Nitro AWS generasi keenam .
Diimplementasikan dalam Rust, Nitro Isolation Engine adalah komponen hypervisor minimal dan bertujuan khusus yang bertanggung jawab untuk menegakkan isolasi antara mesin virtual yang berbagi sumber daya (co-tenanted) . Yang membedakannya dari setiap hypervisor produksi lainnya adalah verifikasi formal: AWS telah menghasilkan bukti yang dapat diperiksa mesin menggunakan asisten pembuktian Isabelle yang secara matematis menunjukkan
:
Secara praktis, ini berarti AWS dapat memberikan kepastian matematis bahwa beban kerja satu pelanggan tidak dapat mengakses data pelanggan lain atau mengganggu eksekusi mereka, dan bahwa operator AWS tunduk pada batasan isolasi yang sama . AWS telah berkomitmen untuk menyediakan implementasi dan bukti Nitro Isolation Engine untuk tinjauan pelanggan
.
Mesin ini diaktifkan secara default pada instans M9g . Ini mewakili pergeseran dalam jaminan keamanan awan: dari kontrol operasional dan narasi audit menuju jaminan yang dapat diperiksa mesin tentang lapisan isolasi fundamental.
Pengguna awal dan mitra tolok ukur yang disebutkan termasuk Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian, dan ClickHouse, bersama HubSpot dan lainnya yang diidentifikasi melalui pengungkapan data performa .
Hasil yang dilaporkan pelanggan mencakup berbagai kategori beban kerja:
Hasil ini mencerminkan pola yang terlihat di seluruh kurva adopsi Graviton: sebagian besar beban kerja melihat peningkatan performa langsung dengan nol atau sedikit perubahan kode saat bermigrasi dari x86 ke Arm, dan peningkatan tersebut berlipat ganda di setiap generasi seiring peningkatan silikon .
Graviton5 hadir di saat silikon server berbasis Arm telah bergeser dari alternatif optimasi biaya menjadi pilihan performa arus utama. Lebih dari setengah kapasitas CPU AWS baru telah berjalan di Graviton selama tiga tahun terakhir, dan 98% dari 1.000 pelanggan EC2 teratas sudah menggunakan instans berbasis Graviton .
Dengan die monolitik 192-core pada proses 3nm, dukungan PCIe Gen 6, memori DDR5-8800, dan penambahan isolasi beban kerja yang terverifikasi secara formal, Graviton5 menaikkan standar tidak hanya untuk keluarga instans AWS sendiri tetapi untuk apa yang secara wajar dapat diharapkan pelanggan dari komputasi berbasis awan: performa, efisiensi energi, dan jaminan keamanan yang didukung oleh bukti matematis, bukan sekadar janji operasional.
Ketersediaan umum instans M9g dan M9gd berarti kemampuan ini sekarang dapat diakses melalui jalur adopsi EC2 standar, dengan varian C9g yang dioptimalkan untuk komputasi dan R9g yang dioptimalkan untuk memori diharapkan menyusul .
Comments
0 comments