듀얼 소켓 기반의 그래비톤4에서 단일 다이 기반의 그래비톤5로의 전환은 소켓 간 통신 오버헤드를 완전히 제거했습니다. 실시간 추론 파이프라인, 인메모리 데이터베이스, 또는 대규모 마이크로서비스 환경 등 여러 코어에 걸쳐 작업을 분산하는 워크로드의 경우, IPC(명령어당 사이클) 향상을 고려하기도 전에 지연 시간 감소만으로도 측정 가능한 처리량 향상을 기대할 수 있습니다.
AWS가 발표한 세대별 개선 사항은 공식 자료, 제3자 분석, 그리고 초기 고객 벤치마크에서 일관되게 나타납니다.
컴퓨팅 및 처리량:
I/O 및 대역폭:
실제 고객사 결과:
이러한 수치는 아키텍처 변화와 일치합니다. 5배 커진 L3 캐시는 특히 큰 데이터 세트를 다루는 데이터베이스 및 분석 워크로드에서 값비싼 DRAM 접근을 줄여줍니다. 더 빨라진 DDR5-8800 메모리와 PCIe Gen 6 I/O는 이전 세대에서 처리량을 제한했던 대역폭 병목 현상을 제거합니다. 그리고 단일 소켓 설계로의 전환은 스케일 아웃 애플리케이션이 NUMA 아키텍처에서 겪는 지연 시간 문제를 줄여줍니다.
고속의 임시 스토리지가 인스턴스에 직접 연결되어야 하는 워크로드를 위해, AWS는 M9gd 변형을 제공합니다. 이 인스턴스는 동일한 그래비톤5 컴퓨팅 플랫폼 위에 로컬 NVMe 기반 SSD 블록 스토리지를 추가하여, 최대 11.4TB의 로컬 NVMe SSD 용량과 이전 세대 로컬 스토리지 대비 30% 더 높은 IOPS를 제공합니다 .
M9gd 변형은 대규모 캐싱 환경, 로그 처리 파이프라인, 그리고 데이터를 CPU에 최대한 가깝게 유지하는 것이 쿼리 지연 시간과 처리량에 직접적인 영향을 미치는 실시간 분석 엔진과 같은 워크로드를 대상으로 합니다. 더 빨라진 코어, 낮아진 코어 간 지연 시간, 그리고 높아진 로컬 스토리지 IOPS의 조합은 스토리지와 컴퓨팅 간의 간극을 좁혀야 하는 모든 워크로드에 M9gd가 최적의 선택임을 의미합니다.
그래비톤5의 주목할 만한 포지셔닝 변화 중 하나는 에이전틱 AI(agentic AI) 워크로드에 대한 AWS의 명확한 타겟팅입니다. 이는 거대 언어 모델(LLM) 및 기타 생성형 AI 기술을 사용하여 실시간 추론, 코드 생성, 다단계 작업 조정을 수행하는 시스템을 말합니다 .
GPU 및 가속기 인스턴스가 훈련 및 대규모 배치 추론 영역을 지배하는 반면, 대규모 에이전틱 AI는 다른 컴퓨팅 패턴을 생성합니다. 모델 추론 단계와 오케스트레이션 로직이 번갈아 나타나는 지속적인 고처리량 CPU 작업이며, 여러 차례의 상호 작용을 위한 엄격한 지연 시간 예산을 필요로 합니다. AWS는 그래비톤5의 33% 낮은 코어 간 지연 시간, 5배 커진 캐시, 그리고 인스턴스당 높은 코어 수가 GPU의 경제적 부담 없이 프로덕션 규모로 실행되어야 하는 이러한 워크로드에 매우 적합하다고 주장합니다 .
원시 성능을 넘어, 그래비톤5 플랫폼에 추가된 기술적으로 가장 중요한 요소는 6세대 AWS 나이트로 시스템의 새로운 구성 요소인 나이트로 격리 엔진(Nitro Isolation Engine) 입니다 .
Rust로 구현된 나이트로 격리 엔진은 공동 임차 가상 머신 간의 격리를 강제하는 역할을 하는 최소한의 특수 목적 하이퍼바이저 구성 요소입니다 . 이 엔진이 다른 모든 프로덕션 하이퍼바이저와 차별화되는 점은 형식 검증입니다. AWS는 이사벨(Isabelle) 증명 보조 도구를 사용하여 다음과 같은 사항을 수학적으로 증명하는 기계 검증 가능한 증명을 생성했습니다
:
실질적인 측면에서 이는 AWS가 한 고객의 워크로드가 다른 고객의 데이터에 접근하거나 실행을 방해할 수 없으며, AWS 운영자조차도 동일한 격리 경계의 적용을 받는다는 수학적 확실성을 제공할 수 있음을 의미합니다 . AWS는 고객이 나이트로 격리 엔진의 구현과 해당 증명을 검토할 수 있도록 제공하겠다고 약속했습니다
.
이 엔진은 M9g 인스턴스에서 기본적으로 활성화됩니다 . 이는 클라우드 보안 보증의 패러다임이 운영 통제 및 감사 기반의 설명에서, 근본적인 격리 계층에 대한 기계 검증 가능한 보장으로 전환되고 있음을 보여줍니다.
공개된 초기 도입 기업 및 벤치마크 파트너로는 메타, 스노우플레이크(Snowflake), 우버, 허니콤, SAP, 아틀라시안(Atlassian), 클릭하우스 등이 있으며, 성능 데이터를 공개한 허브스팟 등도 포함됩니다 .
고객이 보고한 결과는 여러 워크로드 범주에 걸쳐 있습니다.
이러한 결과는 그래비톤 도입 곡선 전반에 걸쳐 나타나는 패턴을 반영합니다. 대부분의 워크로드는 x86에서 Arm으로 마이그레이션할 때 코드 변경이 거의 또는 전혀 없이 즉시 성능 향상을 보이며, 세대가 거듭되고 실리콘이 개선될수록 그 이점은 더 커집니다 .
그래비톤5는 Arm 기반 서버 프로세서가 비용 최적화를 위한 대안에서 주류 성능 선택지로 자리 잡은 시점에 등장했습니다. 지난 3년 동안 신규 AWS CPU 용량의 절반 이상이 그래비톤에서 실행되었으며, 상위 1,000개 EC2 고객의 98%가 이미 그래비톤 기반 인스턴스를 사용하고 있습니다 .
3nm 공정의 단일 192코어 다이, PCIe Gen 6 지원, DDR5-8800 메모리, 그리고 형식 검증된 워크로드 격리 기능을 갖춘 그래비톤5는 AWS 자체의 인스턴스 패밀리뿐만 아니라, 고객이 클라우드 네이티브 컴퓨팅에 대해 합리적으로 기대할 수 있는 기준을 한 단계 끌어올렸습니다. 이는 단순한 운영 약속이 아닌, 수학적 증명으로 뒷받침되는 성능, 에너지 효율성, 그리고 보안 보장입니다.
M9g 및 M9gd 인스턴스의 정식 출시는 이러한 기능을 표준 EC2 도입 경로를 통해 이용할 수 있게 되었음을 의미하며, 컴퓨팅 최적화 C9g 및 메모리 최적화 R9g 인스턴스 변형도 곧 출시될 예정입니다 .
Comments
0 comments