הדגש על "שושלת נקייה" הוא קריטי. דיווחים מצביעים על כך ש-MAI-Thinking-1 אומן על בסיס נתונים ארגוניים עם רישיון מסחרי, ללא כל שימוש בזיקוק מידע (distillation) ממודלים של צד שלישי, כולל סדרת GPT של OpenAI . ניקיון משפטי וטכני זה מעניק למיקרוסופט את היכולת להציע ללקוחותיה הארגוניים מודל שניתן לשלוט עליו ולהתאים אותו באופן מלא, ללא מורכבויות הרישוי המתלוות לספק חיצוני. נאדלה עצמו הודה כי "מיקרוסופט מחזקת את השליטה הבסיסית שלה בעידן ה-AI באמצעות מודל ה-MAI הגדול שלה בפיתוח עצמי, תוך שמירה על היתרון הכפול של השותפות עם OpenAI"
.
מנכ"ל חטיבת ה-AI של מיקרוסופט, מוסטפא סולימאן, סיפק את הטיעון הארגוני בנוגע ליעילות. הוא דיווח כי לאחר כוונון עדין (fine-tuning) של מודלי MAI עבור לקוח כמו מקינזי, המודלים לא רק השתוו אלא אף התעלו על GPT-5.5 של OpenAI מבחינת איכות, תוך תחזית ליעילות עלות טובה עד פי עשרה, בהתבסס על נתוני תמחור ציבוריים . הרצת המודלים הללו על שבב ה-AI הפנימי של מיקרוסופט, Maia 200, מגדילה עוד יותר את יתרון העלות, ויוצרת מקבץ משולב ויעיל במיוחד המפחית את התלות בספקים חיצוניים
. אסטרטגיית ריבוי המודלים הזו מאפשרת למיקרוסופט להשתמש במודל הטוב ביותר עבור כל משימה – בין אם הוא של OpenAI, אנת'רופיק או ממשפחת ה-MAI שלה – בתוך "רתמה" (harness) אחידה, כמו זו שמפעילה את GitHub Copilot
.
מעבר לפיתוח המודלים, נאדלה חשף משמעת תפעולית נוקשה סביב המשאב הקריטי של עידן ה-AI: יחידות עיבוד גרפי (GPU). בעוד שכוח העיבוד בתעשייה כולה נמצא במחסור חמור, מיקרוסופט קיבלה החלטה אסטרטגית מודעת לדחות הכנסות בטווח הקצר. דיווחים מיוני 2026 מאשרים כי מיקרוסופט סירבה למכור את קיבולת ה-GPU שלה למעבדות AI חיצוניות וללקוחות פוטנציאליים אחרים .
במקום זאת, החברה אוגרת את המשאבים היקרים הללו עבור סדרי העדיפויות האסטרטגיים שלה. במהלך ההרצאה המרכזית ב-Build 2026, נאדלה דיבר על ניצול "בסיס ההתקנה המלא של GPUs" באמצעות הרחבת Windows ML ו-Windows AI, מה שהופך בפועל כל מכשיר Windows תואם לצומת מחשוב קצה (edge computing) להרצת מודלי AI מקומיים על המכשיר . אסטרטגיית הקצאה זו מבוססת אך ורק על בניית תיק ההשקעות בעל ערך חיי הלקוח (LTV) הגבוה ביותר. בשיחת רווחים מוקדמת יותר ב-2026, נאדלה כבר תיאר גישה זו: "אנחנו רוצים להקצות קיבולת בזמן שאנחנו תחת מגבלות אספקה, באופן שיאפשר לנו לבנות את תיק ה-LTV הטוב ביותר," כשחלק ניכר מהאצת המוצרים האחרונה היא תוצאה ישירה של הפניית סוף סוף של GPUs לצוותי ה-AI הפנימיים של מיקרוסופט
.
נדבך חדש יותר, אך חיוני לא פחות, בהתבטאויותיו הפומביות של נאדלה, נוגע לאופן שבו מיקרוסופט תגבה תשלום עבור AI בעתיד. בדיון עם דוורקש פאטל, הוא טען כי מנופי המודל העסקי הבסיסיים – פרסום, עסקאות, מינוי וצריכה – יישארו זהים, אך האריזה שלהם תשתנה. הוא תיאר עתיד שבו מינויים מדורגים משמשים כזכאות לכמות מסוימת של צריכת AI, מה שעוזר ללקוחות לנהל תקציב בעוד מיקרוסופט נהנית ממדד השימוש .
מודל היברידי זה כבר מיושם באופן חלקי. עסקי הקידוד של מיקרוסופט, באמצעות GitHub Copilot, כבר פועלים בקנה מידה גדול על בסיס משתמשים ובסיס שימוש . במהלך שיחת הרווחים לרבעון השלישי של 2026, נאדלה וסמנכ"לית הכספים איימי הוד תיארו מעבר נוסף לחיוב מבוסס תוצאות, שבו לקוחות משלמים עבור הערך שנוצר על ידי סוכני AI הפועלים באופן אוטונומי בשמם. "פשוט נחייב על השימוש," סיכמה הוד. "אם לשימוש הזה יש ערך רב עבור הלקוחות... אז הם ימשיכו 'לסובב את המונה', והם ימשיכו להשתמש בשירות"
. דיווח אחד ציין כי החל מ-1 ביוני 2026, תוכניות Copilot יעברו לחיוב מבוסס שימוש באמצעות GitHub AI Credits, אם כי הפריסה הרחבה יותר של מודלים כאלה ב-Microsoft 365 ו-Azure נותרה בגדר התפתחות מתמשכת שאינה מוגדרת לחלוטין
.
השקת מודל ה-MAI ופרטי אסטרטגיית ה-GPU מגובים היטב במספר דיווחים מיוני 2026. ציר הזמן והיקפו הספציפיים של מודל התמחור ההיברידי מבוסס-צריכה מוגדרים פחות במקורות אלו, ומייצגים איתות כיווני משמעותי מצד הנהגת מיקרוסופט, ולא מדיניות מגובשת ומיושמת בכל החברה נכון לנקודת זמן זו.
Comments
0 comments