ה-GB300 NVL72 מתואר כ"סוס העבודה החדש לאימון והסקה" עם נרטיב מפורש של עלות-לכל-טוקן, המשקף את המעבר בתעשייה לכיוון הפעלה של מודלים בקנה מידה ליישומים בזמן אמת . על פי דף המוצר של NVIDIA, הוא מספק פי 1.5 יותר FP4 Tensor Core FLOPS צפופים וביצועי קשב (Attention) גבוהים פי 2 בהשוואה למעבדי NVIDIA Blackwell
.
רשת ברוחב פס גבוה היא עמוד יסוד בפריסה זו. מערכות NVIDIA GB300 NVL72 מחוברות ביניהן באמצעות רשת NVIDIA Spectrum-X Ethernet, רשת Ethernet בעלת תפוקה גבוהה ללא אובדן מנות, שנועדה לסלק צווארי בקבוק בעומסי עבודה מרובי צמתים של AI .
הפריסה כוללת חיבורי 400GbE ו-800GbE, משדרים אופטיים, מתגי Ethernet NVIDIA Spectrum-X ו-SuperNICs . ללא רשת כזו, הרחבת הסקת מסקנות לתפוקה ברמה ארגונית תיצור עיכובים וצווארי בקבוק קריטיים. מסמך ארכיטקטורת הייחוס הארגונית של NVIDIA עבור NVL72 AI Factory מאשר שארכיטקטורת רשת דו-מישורית זו נועדה להפעיל מרכזי נתונים ארגוניים לאימון והסקת AI בקנה מידה עצום, תוך מתן אפשרות ליישומים בזמן אמת ומודלים עם טריליון פרמטרים
.
למרות שהתשתית תומכת גם באימון וגם בהסקה , ההכרזה מדגישה מיקוד ארגוני גובר בהסקת AI (הפריסה בייצור) לצד האימון. מספר סימנים מצביעים על שינוי זה:
המשמעות ברורה: ארגונים עברו את שלב הניסויים וכעת מחפשים תשתית מותאמת לפריסת מודלים בקנה מידה בסביבות ייצור.
מעבר לשותפות עם וולטר, HPE הדגישה מספר יוזמות קשורות:
הבחירה של וולטר ב-HPE וב-NVIDIA מסמנת נקודת מפנה משמעותית. כהיפר-סקיילר הפרטי הגדול בעולם, וולטר מהמרת שארגונים זקוקים לתשתית שיכולה להתמודד עם אימון והסקת מסקנות בזמן אמת בהיקף ענן. על ידי שילוב של מחשוב GPU מבוסס rack של NVIDIA עם ארכיטקטורת ה-AI factory, קירור נוזלי ושירותים של HPE, וולטר ממקמת עצמה כדי לשרת את הגל הבא של עומסי עבודה ארגוניים של AI — מאימון מודלים ועד הסקה בייצור על מודלים עם טריליון פרמטרים.
Comments
0 comments