Graviton4のデュアルソケット設計からGraviton5のモノリシックダイへの移行は、ソケット間通信のオーバーヘッドを完全に排除します。リアルタイム推論パイプライン、インメモリデータベース、大規模マイクロサービス群など、多数のコアにまたがるワークロードでは、レイテンシの低減だけでも、IPC(クロックあたりの命令実行数)の改善を考慮する前から、スループットの大幅な向上が期待できます。
AWSが公式に発表している世代間の性能向上は、公的な情報源、サードパーティの分析、初期の顧客ベンチマークを通じて一貫しています。
コンピューティングとスループット:
I/Oと帯域幅:
実際の顧客事例:
これらの数値は、アーキテクチャの変更点と整合しています。5倍になったL3キャッシュは、特に大規模なワーキングセットを扱うデータベースや分析ワークロードにおいて、低速なDRAMへのアクセスを大幅に削減します。より高速なDDR5-8800メモリとPCIe Gen 6 I/Oは、前世代でスループットを制限していたボトルネックを取り除きます。そして、シングルソケット設計への移行は、スケールアウトするアプリケーションがNUMAアーキテクチャで負っていた「レイテンシ税」を軽減します。
高速な一時ストレージをインスタンスに直接接続する必要があるワークロード向けに、AWSは M9gd バリアントを提供しています。このインスタンスは、同じGraviton5コンピューティング基盤の上に、最大 11.4TB のローカルNVMe SSDブロックストレージを搭載し、前世代のローカルストレージと比較して 30%高いIOPS を提供します 。
M9gdバリアントは、大規模キャッシュフリート、ログ処理パイプライン、リアルタイム分析エンジンなど、データを可能な限りCPUの近くに置くことがクエリレイテンシとスループットに直接影響するワークロードをターゲットにしています。より高速なコア、低減されたコア間レイテンシ、そしてより高いローカルストレージIOPSの組み合わせにより、M9gdはストレージとコンピュートの間のギャップを埋めることで恩恵を受けるあらゆるワークロードに最適な選択肢となります。
Graviton5における特筆すべきポジショニングの変化の一つは、AWSが エージェンティックAI ワークロードを明確にターゲットとしている点です。これは、大規模言語モデル(LLM)やその他の生成AI技術を用いて、リアルタイム推論、コード生成、多段階のタスクオーケストレーションを実行するシステムを指します 。
GPUやアクセラレーターインスタンスが学習や大規模バッチ推論の話題を独占する一方で、大規模なエージェンティックAIの処理パターンは異なります。モデルの推論ステップとオーケストレーションロジックが絶えず交互に実行される、厳しいレイテンシ制約を伴う高スループットなCPU処理が連続的に求められるのです。AWSは、Graviton5の33%低減されたコア間レイテンシ、5倍のキャッシュ、インスタンスあたりの高いコア数が、GPUの経済性に縛られずに本番スケールでこれらのワークロードを実行するのに非常に適していると主張しています 。
生の性能値以上に、Graviton5プラットフォームにおける技術的に最も重要な追加要素は、「Nitro Isolation Engine」 です。これは、第6世代AWS Nitro Systemの新しいコンポーネントです 。
Rust で実装されたNitro Isolation Engineは、同じ物理サーバー上で稼働する複数の仮想マシン間の隔離を強制することだけを目的とした、最小限で専用設計のハイパーバイザーコンポーネントです 。これを他のあらゆる本番環境ハイパーバイザーと一線を画すのが、形式検証です。AWSは、「Isabelle」証明支援系 を用いて、以下の事項を数学的に証明する、機械検証可能な証明を生成しました
。
実践的に言えば、これは、ある顧客のワークロードが別の顧客のデータにアクセスしたり、その実行を妨害したりできないこと、そしてAWSの運用者にも同じ隔離境界が適用されることを、AWSが数学的に確信できることを意味します 。AWSは、Nitro Isolation Engineの実装と対応する証明を、顧客がレビューできるように公開することを約束しています
。
この機能は、M9gインスタンス上ではデフォルトで有効になっています 。これは、クラウドセキュリティの保証において、運用管理や監査の説明から、基盤となる隔離レイヤーに関する機械検証可能な保証への根本的な転換を示すものです。
名前が公表されている主な導入企業やベンチマークパートナーには、Meta、Snowflake、Uber、Honeycomb、SAP、Atlassian、ClickHouse、そしてパフォーマンスデータの開示を通じて特定されたHubSpotなどが含まれます 。
顧客から報告されている成果は、複数のワークロード領域にわたります。
これらの成果は、Gravitonの採用曲線全体に見られるパターンを反映しています。つまり、x86からArmへの移行において、ほとんどのワークロードはコードの変更なし、あるいは最小限の変更で即座にパフォーマンスが向上し、シリコンの改良とともに世代を重ねるごとにその効果はさらに大きくなるのです 。
Graviton5が登場した今、Armベースのサーバーシリコンは、単なるコスト最適化の代替手段から、メインストリームのパフォーマンスチョイスへと完全に移行しました。過去3年間、AWSの新規CPUキャパシティの半分以上はGraviton上で稼働しており、EC2の上位1,000社の顧客の98%が既にGravitonベースのインスタンスを利用しています 。
3nmプロセスによる192コアのモノリシックダイ、PCIe Gen 6サポート、DDR5-8800メモリ、そして形式検証済みのワークロード隔離の追加により、Graviton5はAWS自身のインスタンスファミリーにとっての性能上限を引き上げただけでなく、クラウドネイティブなコンピュートに期待できるものの基準そのものを変えました。それは、パフォーマンス、エネルギー効率、そして運用上の約束ではなく数学的証明に裏打ちされたセキュリティ保証です。
M9gおよびM9gdインスタンスの一般提供開始により、これらの能力は標準的なEC2の採用パスを通じて利用可能になりました。コンピュート最適化型のC9gやメモリ最適化型のR9gの各バリエーションも、今後登場する見込みです 。
Comments
0 comments