דובר מטעם Anthropic ייחס את הבעיה ל"תקלת תשתית קצרה" שגרמה לשגיאות מוגברות במספר מודלי Claude לפרק זמן קצר, ואישר שהבעיה נפתרה .
נוטיון לא פירטה בפומבי אילו ספקי AI חלופיים ספגו את התעבורה המנותבת מחדש, אבל הפעולה של החברה הייתה ברורה: ברגע שמודלי Opus של Anthropic החלו להחזיר תוצאות ירודות, המערכת של נוטיון הסירה אוטומטית את כל המודלים של Anthropic מתפריט הבחירה למשתמש והפנתה את הבקשות למקום אחר .
זוהי דוגמה קונקרטית לארכיטקטורת מעבר אוטומטי בין מספר מודלים (Multi-Model Failover) בפעולה. במקום לאפשר לכשלים מול המשתמש להמשיך ולהתפשט בזמן ההמתנה להתאוששות של Anthropic, נוטיון התייחסה לשכבת מודל ה-AI כאל רכיב שניתן להחלפה — בדיוק כמו שארכיטקט ענן יתייחס למסד נתונים כושל או ל-CDN לא מגיב.
ההפרעה ב-7 ביוני הייתה מינורית בפני עצמה, אבל היא מתרחשת באמצעו של מקבץ תקריות בקלוד שערערו את האמון באמינות הפלטפורמה.
ההפרעה המשמעותית ביותר התרחשה ב-2 ביוני, כאשר השבתה גדולה השפיעה על Claude.ai, ה-API, קונסולת Claude ו-Claude Code. דווח על שיעורי שגיאה גבוהים ב-Opus 4.6 ובמודלים אחרים, ודיווחי משתמשים ב-Downdetector זינקו בסביבות 02:10 שעון החוף המזרחי / 07:10 GMT. ההפרעה הכוללת נמשכה כמעט שש שעות עד שהשירותים שוחזרו במלואם .
שלושה ימים בלבד לאחר מכן, ב-5 ביוני, פלטפורמת Claude של Anthropic שוב קרסה. דף הסטטוס תיעד "שגיאות מוגברות במודלי Claude רבים" מ-15:08 UTC ועד 18:28 UTC, כאשר Opus 4.7 ו-4.8 היו האחרונים להתאושש. האירוע קיבל תפנית חמורה יותר כאשר משתמשים דיווחו שקיבלו תגובות לאחר ההשבתה שנראו כשייכות לסשנים של אנשים אחרים, מה שגרם ל-Anthropic לפתוח בחקירה רשמית של חשש לדליפת מידע .
תקרית קצרה יותר ב-6 ביוני השפיעה על claude.ai, הקונסולה וה-API. Opus 4.8 חווה שירות פגום במשך כ-50 דקות עד שתיקון יושם ונוטר .
המקבץ האחרון לא הגיע משום מקום. Opus 4.7 כבר תיעד חלונות של שגיאות מוגברות ב-22 וב-25 במאי, ונסיגה באיכות תועדה על ידי מפתחים כשבוע לאחר השקת המודל ב-16 באפריל — דפוס ששיקף בעיות עם Opus 4.6 במרץ .
באפריל 2026, Anthropic הכירה בפומבי בירידה באיכות ב-Claude Code, Claude Agent SDK ו-Claude Cowork בין 4 במרץ ל-20 באפריל, ייחסה אותה לשלוש סיבות נפרדות, ומאוחר יותר איפסה את הגבלות המשתמשים לאחר התחקיר .
עבור עסקים שמסתמכים על קלוד כחלק מרכזי במוצר שלהם, לאירוע נוטיון ב-7 ביוני יש לקח פשוט: תלות במודל AI של צד שלישי היא עכשיו סיכון תשתיתי, ויש להתגונן מפניו הנדסית.
מערכת ייצור שקוראת למודל Anthropic יחיד זקוקה לשלוש יכולות נפרדות: אסטרטגיית ניסיון חוזר (Retry) לשגיאות 5xx או 529 זמניות, מודל גיבוי לספיגת הפרעות שירות, ותוכנית הגירה לנסיגות איכות ארוכות טווח או הפסקות שימוש במודלים. הסתמכות על אסטרטגיה אחת בלבד אינה מספקת .
ההשבתה האוטומטית של נוטיון לכל המודלים של Anthropic והניתוב מחדש החלק לספקים חלופיים היא בדיוק הדפוס שיותר משלבים במורד הזרם יצטרכו לאמץ. ללא מעבר אוטומטי בין מספר מודלים, אפילו חלון של 50 דקות של ביצועים ירודים יכול להתגלגל לכשלים מול לקוחות בבוטים של תמיכה, צינורות נתונים, וכלים למהירות פיתוח .
נתוני זמן הפעילות של Anthropic ב-90 הימים האחרונים מראים 98.8% עבור claude.ai ו-99.15% עבור ה-API של Claude . המספרים האלה אמנם נראים סבירים במונחים אבסולוטיים, אבל הם משקפים פלטפורמה שעסקים רבים כבר מתייחסים אליה כתשתית מדרגה ראשונה. מקבץ התקריות בתחילת יוני 2026 — השבתה גלובלית של שש שעות, השבתה של שלוש שעות עם חקירת דליפת מידע, ומספר הפרעות קטנות יותר — מרמז שרף החוסן הנדרש לתלויות ב-AI צריך להיות גבוה יותר מאשר לשירותי SaaS מסורתיים.
ההחלטה של נוטיון להסיר את כל המודלים של Anthropic ב-7 ביוני הייתה תגובה מבצעית שגרתית לבעיית תשתית זמנית. אבל בהקשר של שש הפרעות משמעותיות לקלוד תוך כשישה שבועות, זהו גם איתות ברור: תמה תקופת החסד שבה התייחסנו לבינה מלאכותית יוצרת כאל ניסוי מרגש.
עבור כל צוות שבונה על גבי קלוד — או כל מודל AI של צד שלישי — הנדסת אמינות אינה בגדר אופציה יותר. לוגיקת ניסיון חוזר, ספקי גיבוי, ומסלול הגירת מודל שנבדק הם כעת דרישות הסף לשמירה על מוצר חי כאשר התשתית שמתחתיו מתחילה לרעוד.
Comments
0 comments