Graviton4'ün çift soketli tasarımından, tek parça (monolitik) bir Graviton5 kalıbına geçiş, soketler arası iletişimden kaynaklanan tüm ek yükü ortadan kaldırıyor. Özellikle gerçek zamanlı çıkarım iş hatları, bellek içi veritabanları veya büyük ölçekli mikroservis filoları gibi birçok çekirdeğe yayılan iş yükleri için, gecikme süresindeki bu azalma, döngü başına komut (IPC) iyileştirmelerinden bağımsız olarak bile ölçülebilir verim artışları sağlayabiliyor.
AWS'nin yayınladığı nesiller arası iyileştirmeler, resmi kaynaklar, üçüncü taraf analizleri ve erken müşteri kıyaslamalarıyla tutarlılık gösteriyor:
İşlem ve Verim:
G/Ç ve Bant Genişliği:
Gerçek Dünya Müşteri Sonuçları:
Bu rakamlar mimari değişikliklerle örtüşüyor. 5 kat daha büyük L3 önbellek, özellikle geniş çalışma setleri üzerinde dolaşan veritabanı ve analitik iş yükleri için maliyetli DRAM erişimlerini azaltıyor. Daha hızlı DDR5-8800 bellek ve PCIe Gen 6 G/Ç, önceki nesillerde verimi sınırlayan bant genişliği darboğazlarını ortadan kaldırıyor. Tek soketli tasarıma geçiş ise, NUMA mimarilerinde ölçeklenen uygulamaların ödediği gecikme vergisini düşürüyor.
Yüksek hızlı, geçici depolamanın doğrudan sunucuya bağlı olmasını gerektiren iş yükleri için AWS, M9gd varyantını sunuyor. Bu örnekler, aynı Graviton5 işlem platformunun üzerine yerel NVMe tabanlı SSD blok depolama ekliyor ve bir önceki neslin yerel depolama teklifine kıyasla %30 daha yüksek IOPS ile birlikte 11.4 TB'a kadar yerel NVMe SSD kapasitesi sağlıyor .
M9gd varyantı, büyük ölçekli önbellek filoları, log işleme hatları ve gerçek zamanlı analitik motorları gibi iş yüklerini hedefliyor. Bu tür senaryolarda veriyi işlemciye mümkün olduğunca yakın tutmak, sorgu gecikmesini ve verimi doğrudan etkiliyor. Daha hızlı çekirdekler, daha düşük çekirdekler arası gecikme ve daha yüksek yerel depolama IOPS'sinin birleşimi, M9gd'yi depolama-işlem arasındaki mesafeyi kapatmaktan fayda sağlayan tüm iş yükleri için doğal bir seçenek haline getiriyor.
Graviton5 ile ilgili en dikkat çekici konumlandırma değişikliklerinden biri, AWS'nin etmen tabanlı yapay zeka (agentic AI) iş yüklerini açıkça hedeflemesi . Bu tür sistemler, büyük dil modelleri ve diğer üretken yapay zeka tekniklerini kullanarak gerçek zamanlı akıl yürütme, kod üretimi ve çok adımlı görev orkestrasyonu gerçekleştiriyor.
GPU ve hızlandırıcı örnekleri eğitim ve büyük toplu çıkarım tartışmalarına hakim olsa da, ölçeklenebilir etmen tabanlı yapay zeka farklı bir işlem deseni yaratıyor: Model çıkarım adımları ile orkestrasyon mantığı arasında gidip gelen, çok turlu etkileşimler için katı gecikme bütçeleri olan, sürekli ve yüksek verimli bir CPU işi. AWS, Graviton5'in %33 daha düşük çekirdekler arası gecikme süresi, 5 kat daha büyük önbelleği ve örnek başına yüksek çekirdek sayısının, GPU ekonomisi olmadan üretim ölçeğinde çalışması gereken bu iş yükleri için onu oldukça uygun kıldığını savunuyor .
Ham performansın ötesinde, Graviton5 platformuna yapılan teknik açıdan en önemli ekleme, altıncı nesil AWS Nitro Sistemi'nin yeni bir bileşeni olan Nitro Isolation Engine .
Rust programlama dilinde uygulanan Nitro Isolation Engine, aynı kiracı altında barındırılan sanal makineler arasındaki izolasyonu sağlamaktan sorumlu, minimal ve amaca yönelik olarak inşa edilmiş bir hipervizör bileşenidir . Onu üretim ortamındaki diğer tüm hipervizörlerden ayıran şey ise resmi doğrulama (formal verification) sürecinden geçmiş olmasıdır: AWS, Isabelle kanıt asistanını kullanarak aşağıdakileri matematiksel olarak kanıtlayan makine tarafından kontrol edilebilir kanıtlar üretmiştir
:
Pratikte bu, AWS'nin bir müşterinin iş yüklerinin bir diğerinin verilerine erişemeyeceğini veya yürütülmesine müdahale edemeyeceğini ve AWS operatörlerinin de aynı izolasyon sınırlarına tabi olduğunu matematiksel bir kesinlikle garanti edebilmesi anlamına geliyor . AWS, Nitro Isolation Engine'in uygulamasını ve ilgili kanıtları müşteri incelemesine açma taahhüdünde bulundu
.
Motor, M9g örneklerinde varsayılan olarak etkindir . Bu, bulut güvenlik güvencesinde bir paradigma değişimini temsil ediyor: Operasyonel kontroller ve denetim anlatılarından, temel izolasyon katmanı hakkında makine tarafından kontrol edilebilir garantilere doğru bir geçiş.
İsmi açıklanan erken benimseyenler ve kıyaslama ortakları arasında Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian ve ClickHouse ile birlikte performans verisi açıklamalarıyla tespit edilen HubSpot ve diğerleri yer alıyor .
Müşteri tarafından raporlanan sonuçlar birden fazla iş yükü kategorisini kapsıyor:
Bu sonuçlar, Graviton benimseme eğrisinde görünen kalıpları yansıtıyor: Çoğu iş yükü, x86'dan Arm'a geçiş yaparken sıfır veya minimum kod değişikliği ile anında performans iyileştirmeleri görüyor ve bu kazanımlar, silikon geliştikçe nesiller boyunca birleşerek artıyor .
Graviton5, Arm tabanlı sunucu silikonlarının bir maliyet optimizasyonu alternatifinden ana akım bir performans tercihine dönüştüğü bir dönemde geliyor. AWS'deki yeni CPU kapasitesinin yarısından fazlası son üç yıldır Graviton üzerinde çalışıyor ve en büyük 1.000 EC2 müşterisinin %98'i halihazırda Graviton tabanlı örnekleri kullanıyor .
3nm sürecinde monolitik 192 çekirdekli bir kalıp, PCIe Gen 6 desteği, DDR5-8800 bellek ve resmi olarak doğrulanmış iş yükü izolasyonunun eklenmesiyle Graviton5, yalnızca AWS'nin kendi örnek aileleri için değil, müşterilerin bulut tabanlı işlemden makul olarak bekleyebilecekleri şeyler için de çıtayı yükseltiyor: Operasyonel vaatlerden ziyade matematiksel kanıtlarla desteklenen performans, enerji verimliliği ve güvenlik garantileri.
M9g ve M9gd örneklerinin genel kullanıma sunulması, bu yeteneklere artık standart EC2 benimseme yollarıyla erişilebileceği anlamına geliyor. İşlem odaklı C9g ve bellek odaklı R9g varyantlarının da yakında piyasaya sürülmesi bekleniyor .
Comments
0 comments