Graviton5 mewakili lonjakan seni bina paling ketara AWS sejak keluarga Graviton diperkenalkan. Berikut adalah angka pentingnya:
Peralihan daripada reka bentuk dwi-soket Graviton4 kepada cip monolitik Graviton5 menghapuskan sepenuhnya overhed komunikasi merentas soket. Untuk beban kerja yang tersebar di banyak teras—seperti saluran paip inferens masa nyata, pangkalan data dalam memori, atau kumpulan perkhidmatan mikro berskala besar—pengurangan latensi sahaja sudah boleh memberikan peningkatan pemprosesan yang boleh diukur sebelum sebarang peningkatan IPC (Instructions Per Clock) diambil kira.
Peningkatan prestasi yang diterbitkan oleh AWS adalah konsisten merentas sumber rasmi, analisis pihak ketiga, dan penanda aras pelanggan awal:
Pengkomputeran dan pemprosesan:
I/O dan jalur lebar:
Hasil dunia nyata pelanggan:
Angka-angka ini selari dengan perubahan seni bina. Cache L3 yang 5 kali ganda lebih besar mengurangkan akses DRAM yang mahal, terutamanya untuk pangkalan data dan beban kerja analitik yang melintasi set kerja yang besar. Memori DDR5-8800 yang lebih pantas dan I/O PCIe Gen 6 menghilangkan kesesakan jalur lebar yang mengehadkan pemprosesan pada generasi sebelumnya. Peralihan kepada reka bentuk cip tunggal pula mengurangkan penalti latensi yang dikenakan pada aplikasi berskala mendatar pada seni bina NUMA.
Untuk beban kerja yang memerlukan storan sementara berkelajuan tinggi yang dipasang terus pada instans, AWS menawarkan varian M9gd. Instans ini melapisi storan blok SSD NVMe tempatan di atas platform pengkomputeran Graviton5 yang sama, menyediakan sehingga 11.4 TB kapasiti SSD NVMe tempatan dengan IOPS 30% lebih tinggi daripada tawaran storan tempatan generasi sebelumnya .
Varian M9gd menyasarkan beban kerja seperti kumpulan cache berskala besar, saluran paip pemprosesan log, dan enjin analitik masa nyata di mana menyimpan data sedekat mungkin dengan CPU memberi kesan langsung kepada latensi dan pemprosesan pertanyaan. Gabungan teras yang lebih pantas, latensi antara teras yang lebih rendah, dan IOPS storan tempatan yang lebih tinggi menjadikan M9gd pilihan ideal untuk sebarang beban kerja yang mendapat manfaat daripada merapatkan jurang antara storan dan pengkomputeran.
Salah satu perubahan kedudukan yang paling ketara dengan Graviton5 adalah sasaran eksplisit AWS terhadap beban kerja AI agentik—sistem yang melakukan penaakulan masa nyata, penjanaan kod, dan orkestrasi tugas berbilang langkah menggunakan model bahasa besar dan teknik AI generatif lain .
Walaupun instans GPU dan pemecut mendominasi perbualan tentang latihan dan inferens kumpulan besar, AI agentik pada skala besar mencipta corak pengkomputeran yang berbeza: kerja CPU pemprosesan tinggi yang berterusan yang bergantian antara langkah inferens model dan logik orkestrasi, dengan bajet latensi yang ketat untuk interaksi berbilang giliran. AWS berhujah bahawa latensi antara teras 33% lebih rendah Graviton5, cache 5 kali ganda lebih besar, dan kiraan teras yang tinggi per instans menjadikannya sangat sesuai untuk beban kerja ini apabila ia perlu dijalankan pada skala pengeluaran tanpa bebanan ekonomi GPU .
Di luar prestasi mentah, penambahan paling ketara dari segi teknikal pada platform Graviton5 adalah Enjin Pengasingan Nitro, komponen baharu dari Sistem Nitro AWS generasi keenam .
Dilaksanakan dalam bahasa pengaturcaraan Rust, Enjin Pengasingan Nitro adalah komponen hypervisor yang minimal dan dibina khas yang bertanggungjawab untuk menguatkuasakan pengasingan antara mesin maya yang berkongsi pelayan fizikal . Apa yang membezakannya daripada setiap hypervisor pengeluaran lain adalah pembuktian formal: AWS telah menghasilkan bukti yang boleh disemak secara mesin menggunakan pembantu bukti Isabelle yang secara matematik menunjukkan
:
Secara praktikal, ini bermakna AWS boleh memberikan kepastian matematik bahawa beban kerja seorang pelanggan tidak boleh mengakses data pelanggan lain atau mengganggu pelaksanaan mereka, dan pengendali AWS tertakluk pada sempadan pengasingan yang sama . AWS telah komited untuk menyediakan pelaksanaan Enjin Pengasingan Nitro dan bukti yang sepadan untuk semakan pelanggan
.
Enjin ini diaktifkan secara lalai pada instans M9g . Ini mewakili satu anjakan dalam jaminan keselamatan awan: dari kawalan operasi dan naratif audit kepada jaminan yang boleh disemak secara mesin tentang lapisan pengasingan asas.
Pengguna awal dan rakan penanda aras yang dinamakan termasuk Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian, dan ClickHouse, bersama-sama HubSpot dan lain-lain yang dikenal pasti melalui pendedahan data prestasi .
Keputusan yang dilaporkan pelanggan merangkumi pelbagai kategori beban kerja:
Keputusan ini mencerminkan corak yang kelihatan merentas lengkung penggunaan Graviton: kebanyakan beban kerja menyaksikan peningkatan prestasi segera tanpa perubahan kod, atau dengan perubahan kod yang minimum, apabila berhijrah dari x86 ke Arm, dan peningkatan ini bertambah merentas generasi apabila cip silikon bertambah baik .
Graviton5 tiba pada saat cip silikon pelayan berasaskan Arm telah beralih dari alternatif pengoptimuman kos kepada pilihan prestasi arus perdana. Lebih separuh daripada kapasiti CPU AWS baharu telah berjalan pada Graviton sejak tiga tahun lalu, dan 98% daripada 1,000 pelanggan EC2 teratas sudah menggunakan instans berasaskan Graviton .
Dengan cip monolitik 192-teras pada proses 3nm, sokongan PCIe Gen 6, memori DDR5-8800, dan penambahan pengasingan beban kerja yang dibuktikan secara formal, Graviton5 meningkatkan siling bukan sahaja untuk keluarga instans AWS sendiri tetapi untuk apa yang boleh diharapkan oleh pelanggan daripada pengkomputeran awan: prestasi, kecekapan tenaga, dan jaminan keselamatan yang disokong oleh bukti matematik dan bukannya janji operasi.
Ketersediaan umum instans M9g dan M9gd bermakna keupayaan ini kini boleh diakses melalui laluan penggunaan EC2 standard, dengan varian C9g (dioptimumkan untuk pengkomputeran) dan R9g (dioptimumkan untuk memori) dijangka menyusul .
Comments
0 comments