המעבר מתכנון Dual-Socket ל-Monolithic Die מבטל לחלוטין את תקרת התקשורת בין השבבים. עבור עומסי עבודה שמתפרסים על פני ליבות רבות — כמו צינורות עיבוד הסקה (Inference) בזמן אמת, מסדי נתונים בזיכרון, או ציים גדולים של מיקרו-שירותים — הפחתת ההשהיה לבדה יכולה להניב שיפור משמעותי בתפוקה, עוד לפני שמתחשבים בשיפורים בביצועי הליבה עצמה.
ההצהרות הרשמיות של AWS עקביות עם ניתוחים חיצוניים ומדדים ראשוניים של לקוחות:
כוח מחשוב ועיבוד:
קלט/פלט ורוחב פס:
תוצאות מהשטח — לקוחות אמיתיים:
המספרים הללו אינם מקרה. הגידול העצום בזיכרון המטמון L3 (פי 5) מצמצם גישות לזיכרון DRAM, בעיקר עבור אנליטיקות ומסדי נתונים. זיכרון DDR5-8800 ו-PCIe Gen 6 מסירים צווארי בקבוק שתחמו תפוקה בעבר. והמעבר לשבב בודד מפחית את "מס ההשהיה" שמשלמות אפליקציות מבוזרות בארכיטקטורות NUMA.
עבור עומסים הדורשים אחסון מהיר במיוחד הצמוד ישירות למופע, מציעה AWS את גרסת M9gd. מופעים אלה מוסיפים נפח אחסון NVMe SSD מקומי על גבי אותה פלטפורמת מחשוב Graviton5, ומספקים עד 11.4 טרה-בייט של NVMe SSD עם ביצועי IOPS גבוהים ב-30% לעומת הדור הקודם .
גרסה זו מכוונת לעומסים כמו ציים גדולים של שרתי Cache, צינורות עיבוד לוגים, ומנועי ניתוח נתונים בזמן-אמת, שבהם שמירת המידע קרוב ככל האפשר למעבד משפיעה באופן ישיר על זמני התגובה.
אחד השינויים הבולטים בהצהרות AWS הוא ההתייחסות הישירה לעומסי "בינה מלאכותית אוטונומית" (Agentic AI) — מערכות המבצעות הסקת מסקנות, כתיבת קוד, או תזמור משימות רב-שלביות בזמן אמת תוך שימוש במודלי שפה גדולים (LLMs) .
בעוד ש-GPU שולט באימון והסקה בקנה מידה גדול, Agentic AI מייצר דפוס שונה: עבודת CPU רציפה בתפוקה גבוהה, המשלבת צעדי הסקת מודל (Inference) עם לוגיקת תזמור. AWS טוענת שהחביון הבין-ליבתי הנמוך, המטמון העצום וספירת הליבות הגבוהה של Graviton5 הופכים אותו לאידיאלי לעומסים אלה כשיש להריץ אותם בקנה מידה ייצור מבלי לשלם את עלויות האצה ייעודיות .
מעבר לביצועים, התוספת הטכנית המשמעותית ביותר בפלטפורמת Graviton5 היא Nitro Isolation Engine — רכיב חדש בדור השישי של מערכת Nitro .
הרכיב, הממומש בשפת התכנות Rust, הוא היפרוויזור מינימלי שאחראי על אכיפת בידוד בין מכונות וירטואליות המתארחות על אותה תשתית פיזית . מה שמבדיל אותו מכל וירטואליזציה אחרת הוא האימות הפורמלי (Formal Verification): AWS הפיקה הוכחות הניתנות לבדיקה ממוחשבת באמצעות כלי הסיוע Isabelle, הממחישות מתמטית
:
בפועל, AWS יכולה להבטיח וודאות מתמטית שמטען של לקוח א' אינו יכול לגשת למידע של לקוח ב' או להפריע להרצה שלו, ושגם מפעילי AWS כפופים לאותן מגבלות בידוד . AWS התחייבה לאפשר גישה למימוש המנוע וההוכחות לבדיקת לקוחות
.
המנוע מופעל כברירת מחדל במופעי M9g . מדובר בשינוי תפיסה מהותי באבטחת ענן: מעבר מבקרה תפעולית ודוחות ביקורת, לעבר ערבויות הניתנות לבדיקה מתמטית על שכבת הבידוד הבסיסית ביותר.
בין המאמצים המוקדמים והשותפים לבחינת ביצועים ששמם פורסם רשמית נמנים: Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian, ClickHouse, כמו גם HubSpot .
התוצאות משתרעות על פני קטגוריות מרובות:
Graviton5 מגיע ברגע שבו מעבדי Arm בשרתים הפכו מאלטרנטיבה חוסכת בעלויות לבחירת מיינסטרים לגיטימית. יותר ממחצית מקיבולת המחשוב החדשה של AWS רצה על Graviton בשלוש השנים האחרונות, ו-98% מ-1,000 לקוחות EC2 המובילים כבר משתמשים במעבדי Graviton .
עם 192 ליבות בתהליך 3nm, תמיכה ב-PCIe Gen 6, זיכרון DDR5-8800, ומעטפת בידוד מאומתת מתמטית, Graviton5 לא סתם מעלה את הרף עבור משפחות מופעי הענן של AWS — הוא משנה את הציפיות של הלקוחות ממה שמחשוב ענן אמור לספק. ההבטחה היא לביצועים, יעילות אנרגטית, וערבות אבטחה המגובות בהוכחה מתמטית, לא בהבטחות תפעוליות.
Comments
0 comments