डुअल-सॉकेट Graviton4 डिज़ाइन से एक मोनोलिथिक Graviton5 डाई पर जाने से क्रॉस-सॉकेट संचार ओवरहेड पूरी तरह समाप्त हो जाता है। कई कोर में फैले वर्कलोड के लिए — रीयल-टाइम इंफ़रेंस पाइपलाइन, इन-मेमोरी डेटाबेस, या बड़े पैमाने पर माइक्रोसर्विस फ्लीट — अकेले लेटेंसी में कमी किसी भी IPC सुधार पर विचार करने से पहले मापने योग्य थ्रूपुट लाभ प्रदान कर सकती है।
AWS के प्रकाशित पीढ़ीगत सुधार आधिकारिक स्रोतों, तृतीय-पक्ष विश्लेषण और प्रारंभिक ग्राहक बेंचमार्क में सुसंगत हैं:
कंप्यूट और थ्रूपुट:
I/O और बैंडविड्थ:
वास्तविक दुनिया के ग्राहक परिणाम:
ये संख्याएँ वास्तुशिल्पीय परिवर्तनों के साथ संरेखित हैं। 5× बड़ी L3 कैश महंगी DRAM एक्सेस को कम करती है, विशेष रूप से डेटाबेस और एनालिटिक्स वर्कलोड के लिए जो बड़े वर्किंग सेट को पार करते हैं। तेज़ DDR5-8800 मेमोरी और PCIe Gen 6 I/O बैंडविड्थ अड़चनों को दूर करते हैं जो पिछली पीढ़ियों पर थ्रूपुट को सीमित करते थे। और सिंगल-सॉकेट डिज़ाइन में बदलाव उस लेटेंसी कर को कम करता है जो स्केल-आउट एप्लिकेशन NUMA आर्किटेक्चर पर चुकाते हैं।
उन वर्कलोड के लिए जिन्हें इंस्टेंस से सीधे जुड़े हाई-स्पीड एफ़ेमेरल स्टोरेज की आवश्यकता होती है, AWS M9gd वेरिएंट प्रदान करता है। ये इंस्टेंस उसी Graviton5 कंप्यूट प्लेटफ़ॉर्म के शीर्ष पर लोकल NVMe-आधारित SSD ब्लॉक स्टोरेज को परत करते हैं, जो पिछली पीढ़ी के लोकल स्टोरेज ऑफ़रिंग की तुलना में 30% अधिक IOPS के साथ 11.4 TB तक की लोकल NVMe SSD क्षमता प्रदान करते हैं ।
M9gd वेरिएंट बड़े पैमाने पर कैशिंग फ्लीट, लॉग प्रोसेसिंग पाइपलाइन और रीयल-टाइम एनालिटिक्स इंजन जैसे वर्कलोड को लक्षित करता है, जहाँ डेटा को यथासंभव CPU के करीब रखना सीधे क्वेरी लेटेंसी और थ्रूपुट को प्रभावित करता है। तेज़ कोर, कम इंटर-कोर लेटेंसी और उच्च लोकल स्टोरेज IOPS का संयोजन M9gd को किसी भी वर्कलोड के लिए एक स्वाभाविक फिट बनाता है जो स्टोरेज-कंप्यूट की खाई को पाटने से लाभान्वित होता है।
Graviton5 के साथ अधिक उल्लेखनीय स्थिति परिवर्तनों में से एक है AWS का एजेंटिक AI वर्कलोड का स्पष्ट लक्ष्यीकरण - ऐसी प्रणालियाँ जो बड़े भाषा मॉडल और अन्य जनरेटिव AI तकनीकों का उपयोग करके वास्तविक समय रीजनिंग, कोड जनरेशन और मल्टी-स्टेप टास्क ऑर्केस्ट्रेशन करती हैं ।
जबकि GPU और एक्सेलेरेटर इंस्टेंस प्रशिक्षण और बड़े-बैच इंफ़रेंस वार्तालाप पर हावी हैं, बड़े पैमाने पर एजेंटिक AI एक अलग कंप्यूट पैटर्न बनाता है: मॉडल इंफ़रेंस चरणों और ऑर्केस्ट्रेशन तर्क के बीच बारी-बारी से निरंतर उच्च-थ्रूपुट CPU कार्य, मल्टी-टर्न इंटरैक्शन के लिए सख्त लेटेंसी बजट के साथ। AWS का तर्क है कि Graviton5 की 33% कम इंटर-कोर लेटेंसी, 5× बड़ी कैश और प्रति इंस्टेंस उच्च कोर काउंट इसे इन वर्कलोड के लिए उपयुक्त बनाती है जब उन्हें GPU अर्थशास्त्र के बिना उत्पादन पैमाने पर चलाने की आवश्यकता होती है ।
कच्चे प्रदर्शन से परे, Graviton5 प्लेटफ़ॉर्म में सबसे तकनीकी रूप से महत्वपूर्ण जोड़ नाइट्रो आइसोलेशन इंजन है, जो छठी पीढ़ी के AWS नाइट्रो सिस्टम का एक नया घटक है ।
Rust में कार्यान्वित, नाइट्रो आइसोलेशन इंजन एक न्यूनतम, उद्देश्य-निर्मित हाइपरवाइजर घटक है जो सह-किरायेदार वर्चुअल मशीनों के बीच अलगाव लागू करने के लिए जिम्मेदार है । जो चीज इसे हर दूसरे उत्पादन हाइपरवाइजर से अलग करती है, वह है औपचारिक सत्यापन: AWS ने Isabelle प्रूफ असिस्टेंट का उपयोग करके मशीन-जांच योग्य प्रमाण तैयार किए हैं जो गणितीय रूप से प्रदर्शित करते हैं
:
व्यावहारिक रूप में, इसका मतलब है कि AWS गणितीय निश्चितता प्रदान कर सकता है कि एक ग्राहक का वर्कलोड दूसरे के डेटा तक नहीं पहुँच सकता या उनके निष्पादन में हस्तक्षेप नहीं कर सकता, और यह कि AWS ऑपरेटर समान अलगाव सीमाओं के अधीन हैं । AWS ने नाइट्रो आइसोलेशन इंजन के कार्यान्वयन और संबंधित प्रमाणों को ग्राहक समीक्षा के लिए उपलब्ध कराने की प्रतिबद्धता जताई है
।
इंजन M9g इंस्टेंस पर डिफ़ॉल्ट रूप से सक्षम है । यह क्लाउड सुरक्षा आश्वासन में एक बदलाव का प्रतिनिधित्व करता है: परिचालन नियंत्रण और ऑडिट कथाओं से हटकर मूलभूत अलगाव परत के बारे में मशीन-जांच योग्य गारंटी की ओर।
नामित शुरुआती अपनाने वालों और बेंचमार्क भागीदारों में Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian, और ClickHouse शामिल हैं, साथ ही HubSpot और अन्य जिन्हें प्रदर्शन डेटा प्रकटीकरण के माध्यम से पहचाना गया ।
ग्राहक-रिपोर्ट किए गए परिणाम कई वर्कलोड श्रेणियों में फैले हैं:
ये परिणाम ग्रेविटॉन अपनाने की अवस्था में दिखाई देने वाले पैटर्न को दर्शाते हैं: अधिकांश वर्कलोड x86 से आर्म में माइग्रेट करते समय शून्य या न्यूनतम कोड परिवर्तनों के साथ तत्काल प्रदर्शन सुधार देखते हैं, और जैसे-जैसे सिलिकॉन में सुधार होता है, पीढ़ियों में लाभ बढ़ता जाता है ।
Graviton5 ऐसे समय में आता है जब आर्म-आधारित सर्वर सिलिकॉन लागत-अनुकूलन विकल्प से एक मुख्यधारा प्रदर्शन विकल्प बन गया है। पिछले तीन वर्षों से आधे से अधिक नई AWS CPU क्षमता ग्रेविटॉन पर चल रही है, और शीर्ष 1,000 EC2 ग्राहकों में से 98% पहले से ही ग्रेविटॉन-आधारित इंस्टेंस का उपयोग करते हैं ।
3nm प्रक्रिया पर एक मोनोलिथिक 192-कोर डाई, PCIe Gen 6 सपोर्ट, DDR5-8800 मेमोरी और औपचारिक रूप से सत्यापित वर्कलोड आइसोलेशन के जुड़ने के साथ, Graviton5 न केवल AWS के अपने इंस्टेंस परिवारों के लिए, बल्कि क्लाउड-नेटिव कंप्यूट से ग्राहक जो उचित रूप से अपेक्षा कर सकते हैं, उसके लिए सीमा बढ़ाता है: प्रदर्शन, ऊर्जा दक्षता, और परिचालन वादों के बजाय गणितीय प्रमाण द्वारा समर्थित सुरक्षा गारंटी।
M9g और M9gd इंस्टेंस की सामान्य उपलब्धता का मतलब है कि ये क्षमताएँ अब मानक EC2 अपनाने पथों के माध्यम से सुलभ हैं, जिसमें कंप्यूट-अनुकूलित C9g और मेमोरी-अनुकूलित R9g वेरिएंट के अनुसरण की उम्मीद है ।
Comments
0 comments