אבל המציאות היא ש-Anthropic כבר נעה באגרסיביות בכל הנוגע לתמחור. ב-9 ביוני, יומיים בלבד לפני פרסום הידיעה על OpenAI, השיקה Anthropic את Claude Fable 5 במחיר של 10 דולר למיליון טוקני קלט ו-50 דולר למיליון טוקני פלט — מחצית מהמחיר של מודל Mythos Preview הקודם. המודל החדש השיג ציון של 80.3% במדד SWE-Bench Pro, יתרון של 22 נקודות על הציון 58.6% של GPT-5.5 של OpenAI . Anthropic גם הציגה מצב "קומפקטי" זול פי 8, וב-14 במאי שינתה את מבנה המנויים כך שמשתמשים כבדים ב-Agent SDK של Claude יועברו מחבילות מנוי בתשלום קבוע לחיוב מדוד לפי שימוש בממשק API, החל מה-15 ביוני
.
קריאה כנה של התחרות מלמדת ש-OpenAI אינה פועלת מעמדת כוח. קיצוצי המחירים הם תגובה לעמדת שוק שאבדה, לא מחווה נדיבה .
מנכ"ל OpenAI, סם אלטמן, הודה בפומבי באירוע שהתקיים לאחרונה כי עלויות השימוש בבינה מלאכותית הפכו ל"בעיה ענקית" עבור לקוחות ארגוניים . אלכסנדר אמביריקוס, ראש חטיבת הארגונים ב-OpenAI, אמר ל-TechCrunch כי השיח מול הלקוחות עבר שינוי מהותי: "לפני חצי שנה, כשהייתי משוחח עם לקוח, הכל היה סביב 'מה זה יכול לעשות? האם זה מספיק טוב?'. השיחות שלנו היום אף פעם לא עוסקות בזה. עכשיו השיחות הן על 'היי, אנחנו מוציאים המון כסף. איזו שקיפות יש לכם? אילו כלי ביקורת יש לכם?'"
.
היקף ההוצאות הארגוניות מדהים. אלטמן חשף כי לקוח אחד של OpenAI צורך ב-100 מיליארד טוקנים בחודש, השקול לכ-100,000–300,000 דולר בחודש בתעריפים ארגוניים משולבים . אלטמן הוסיף שהחברה הייתה רוצה לחייב על AI "כמו חשמל" — מודל של תשלום לפי שימוש שנשמע מפתה בתיאוריה, אך הופך למפחיד עבור מנהלי כספים כאשר המונה לעולם לא מפסיק לפעול
.
שתי החברות רואות בכלי הפיתוח את ראש הגשר הקריטי לאימוץ בינה מלאכותית ארגונית. OpenAI הוזילה את המנוי "Pro" שלה ל-100 דולר לחודש באפריל 2026, במטרה ספציפית להפוך את כלי התכנות Codex שלה לזולים יותר עבור מפתחים מקצועיים . ה-Claude Code ו-Agent SDK של Anthropic ממוצבים כחלופות ישירות.
השינוי במדיניות התשלומים של Anthropic ביוני הסיר למעשה סבסוד של פי 15–30 שהפך שימוש כבד ב-SDK לזול באופן מלאכותי בתוכניות בתשלום קבוע, דבר שיעלה משמעותית את העלויות עבור המשתמשים הכבדים ביותר של Claude Code . העיתוי של קיצוצי המחירים המדווחים של OpenAI, ימים ספורים לאחר השקת המודל של Anthropic ולפני שינוי החיוב ב-15 ביוני, מרמז על ניסיון מכוון לנצל את רגע ההלם של הלקוחות מהעלות החדשה.
לא ניתן להבין את משבר התמחור ללא ההקשר המקביל של קריסת נרטיב הפרודוקטיביות של "טוקנמוקסינג". טוקנמוקסינג — הנוהג להתייחס לצריכת טוקני AI כמדד לפרודוקטיביות הנדסית — הפך לתרבות פנימית בעמק הסיליקון לאורך 2025 ותחילת 2026. ה"ניו יורק טיימס" דיווח במרץ שמהנדס ב-OpenAI עיבד 210 מיליארד טוקנים בשבוע אחד, ובאמזון, חלק מהעובדים הקימו סוכני AI לביצוע משימות "חסרות משמעות או מיותרות לחלוטין" רק כדי לשמור על סטטיסטיקות שימוש גבוהות בטוקנים .
אך הנתונים התהפכו באופן נחרץ נגד הנוהג הזה. חברת ניתוח ההנדסה Faros AI, שניתחה נתונים מ-22,000 מפתחים ב-4,000 צוותים, מצאה כי בעוד שאימוץ AI האיץ את תפוקת המשימות (עלייה של 34% בהשלמת משימות, 66% באפיקים), הוא גם העלה את מספר הבאגים למפתח ב-54%, את זמן סקירת הקוד החציוני פי 5, ואת שיעור ה-Churn (שינויי קוד) ב-861% בסביבות עם אימוץ AI גבוה .
שיעורי קבלת הקוד הראשוניים של 80–90% — שמנהלים חגגו — התבררו כאשליה. כשחוקרים עקבו אחר גרסאות הקוד בשבועות שלאחר מכן, שיעור הקבלה בפועל צנח ל-10–30%, וחשף חוב טכני סמוי משמעותי . חברת Jellyfish מצאה כי 10% ממשתמשי Claude Code הכבדים צרכו בערך פי 10 יותר טוקנים מהמפתח החציוני, אך הפיקו רק פי 2 יותר תפוקה
. העלות לבקשת משיכה (Pull Request) מאוחדת עלתה מ-0.28 דולר בשימוש קל ב-AI עד ל-89 דולר בשימוש כבד, על פי נתונים של חברת התוכנה Jellyfish
.
גם מחוץ לעולם ההנדסה, הטיעון לפרודוקטיביות רחבה יותר מתפורר. דו"ח BCG לשנת 2026 בנושא AI במקום העבודה, שסקר קרוב ל-12,000 עובדים, מצא כי 42% ממשתמשי ה-AI הקבועים דיווחו על חיסכון של שמונה שעות בשבוע, השווה ערך ליום עבודה מלא. אך 66% אמרו שקיבלו הדרכה מוגבלת עד אפסית לגבי מה לעשות עם הזמן שחסכו, ומחציתם אמרו שהם לא היו יותר פרודוקטיביים באופן מדיד . סמנכ"ל התפעול של Uber, אנדרו מקדונלד, הודה שהחברה מתקשה לקשר בין השיפור בפרודוקטיביות של העובד הבודד לבין השפעה כלל-חברתית
.
מנהל הלקוחות הראשי של ServiceNow, כריס בדי, תמצת את הספקנות הגוברת בחריפות: "זה כמעט כמו למדוד הצלחה של מסעדה לפי כמות האוכל שהיא קונה, ולא לפי כמה לקוחות מרוצים יוצאים ממנה. יש חשבון לשלם על הטוקנים האלה" .
השיח הארגוני עבר מ"להאיץ" ל"אנחנו צריכים מעקות בטיחות" . שינוי זה מאיים ישירות על מודל ההכנסות הבסיסי של ספקי AI, שמרוויחים משימוש בלתי מוגבל.
גם OpenAI וגם Anthropic מתכוננות על פי דיווחים להנפקות ראשוניות לציבור . לוח הזמנים הזה הופך את כלכלת מלחמת המחירים למסוכנת במיוחד. קיצוצים אגרסיביים במחיר הטוקנים לוחצים ישירות על שולי הרווח בדיוק ברגע ששתי החברות צריכות להציג כלכלת יחידה בת-קיימא למשקיעי השוק הציבורי. הורדת מחירים ללא הפחתות מתאימות בעלויות המחשוב העצומות הנדרשות לאימון ולהרצה עלולה להפוך את הרווחיות לחמקמקה עוד יותר
.
אך החשש העמוק יותר של המשקיעים נוגע לעלויות המעבר — או ליתר דיוק, להיעדרן. סקר שנערך במרץ ואפריל 2026 בקרב 200 מנהלים על ידי Wakefield Research מצא כי 79% מהנשאלים היו מעט או מאוד מודאגים מנעילה מול ספקי הבינה המלאכותית הנוכחיים שלהם . כאשר הפלט של מודל AI אחד טוב בערך כמו של אחר עבור משימה נתונה, ושילוב ממשקי API הוא פשוט יחסית, לקוחות ארגוניים יכולים לעבור לאופציה הזולה יותר בחיכוך מינימלי.
עידן ה"אכול כפי יכולתך" של AI הסתיים . מה שמתהווה במקומו נראה פחות כמו מלחמת פלטפורמות שבה המנצח לוקח הכל, ויותר כמו קרב תמחור סחורות שבו הספק בעל מבנה העלויות הרזה ביותר שורד. התוכנית המדווחת של OpenAI להוזלת מחירים היא, בבסיסה, הכרה בכך שהמוצר עצמו אינו מבדל מספיק כדי להצדיק פרמיה כאשר הלקוחות בוחנים כל טוקן בזכוכית מגדלת.
Comments
0 comments