Il responsabile di prodotto di Notion, Max Schoening, ha confermato che l'accesso ai modelli di Anthropic è stato ripristinato circa 12 ore dopo l'inizio del disservizio. Ha descritto l'evento come un'interruzione temporanea standard del servizio, sottolineando che episodi del genere accadono a tutte le principali piattaforme, inclusa Notion stessa, GitHub e AWS .
Un portavoce di Anthropic ha attribuito il problema a "un breve problema infrastrutturale" che ha causato errori elevati su più modelli Claude per un breve periodo, confermando che la questione è stata risolta .
Notion non ha reso noti i dettagli su quali fornitori AI alternativi abbiano assorbito il traffico dirottato, ma l'azione dell'azienda è stata chiara: nel momento in cui i modelli Opus di Anthropic hanno cominciato a restituire risultati degradati, il sistema di Notion ha rimosso automaticamente tutti i modelli Anthropic dal selettore visibile all'utente e reindirizzato le richieste altrove .
Questo è un esempio concreto di un'architettura di "failover" multi-modello in azione. Invece di permettere che i fallimenti lato utente si propagassero a cascata aspettando il recupero di Anthropic, Notion ha trattato il livello del modello AI come un componente intercambiabile — esattamente come un architetto cloud tratterebbe un database in avaria o una CDN non reattiva.
L'interruzione del 7 giugno, di per sé, è stata minore, ma si inserisce nel mezzo di un gruppo di incidenti che hanno scosso la fiducia nell'affidabilità della piattaforma Claude.
Il disservizio più significativo si è verificato il 2 giugno, quando un grave blackout ha colpito Claude.ai, le API, la Console Claude e Claude Code. Sono stati segnalati tassi di errore elevati su Opus 4.6 e altri modelli, con le segnalazioni degli utenti su Downdetector che hanno raggiunto un picco intorno alle 02:10 ET / 07:10 GMT. L'interruzione totale è durata quasi sei ore prima che i servizi fossero completamente ripristinati .
Appena tre giorni dopo, il 5 giugno, la piattaforma Claude di Anthropic è andata offline di nuovo. La pagina di stato ha registrato "errori elevati su molti modelli Claude" dalle 15:08 UTC alle 18:28 UTC, con Opus 4.7 e 4.8 che sono stati gli ultimi a riprendersi. L'incidente ha preso una piega più seria quando alcuni utenti hanno riferito di aver ricevuto, dopo il blackout, risposte che sembravano appartenere a sessioni di altre persone, spingendo Anthropic ad aprire un'indagine formale su una potenziale fuga di dati .
Un incidente più breve il 6 giugno ha colpito claude.ai, la console e le API. Opus 4.8 ha subito un servizio degradato per circa 50 minuti prima che fosse implementata e monitorata una correzione .
Quest'ultimo gruppo di problemi non è spuntato dal nulla. Opus 4.7 aveva già registrato finestre di errori elevati il 22 e 25 maggio, e una regressione della qualità è stata documentata dagli sviluppatori circa una settimana dopo il lancio del modello il 16 aprile — uno schema che rispecchiava i problemi con Opus 4.6 a marzo .
Nell'aprile 2026, Anthropic ha riconosciuto pubblicamente un calo di qualità in Claude Code, Claude Agent SDK e Claude Cowork tra il 4 marzo e il 20 aprile, attribuendolo a tre cause distinte e, dopo un'analisi post-mortem, ripristinando le restrizioni per gli utenti .
Per le aziende che si affidano a Claude come parte centrale del loro prodotto, l'incidente di Notion del 7 giugno porta con sé una lezione molto chiara: la dipendenza da modelli AI di terze parti è ora un rischio infrastrutturale, e va gestita con le giuste contromisure ingegneristiche.
Un sistema di produzione che invoca un singolo modello Anthropic ha bisogno di tre capacità distinte: una strategia di retry per gli errori transitori 5xx o 529, un modello di fallback per assorbire le interruzioni del servizio e un piano di migrazione per regressioni di qualità a lungo termine o deprecazioni del modello. Affidarsi a una sola di queste strategie non è sufficiente .
La disabilitazione automatica di Notion di tutti i modelli Anthropic e il suo reindirizzamento senza intoppi verso fornitori alternativi è esattamente lo schema che sempre più integratori dovranno adottare. Senza un failover multi-modello, anche una finestra di 50 minuti di prestazioni degradate può trasformarsi in fallimenti rivolti al cliente su chatbot di assistenza, pipeline di dati e strumenti per la produttività degli sviluppatori .
I dati sull'uptime a 90 giorni di Anthropic mostrano il 98,8% per claude.ai e il 99,15% per le API di Claude . Sebbene questi numeri sembrino ragionevoli in termini assoluti, riflettono una piattaforma che molte aziende ora trattano come un'infrastruttura di primo livello. La concentrazione di incidenti all'inizio di giugno 2026 — un blackout globale di sei ore, uno di tre ore con un'indagine per fuga di dati e molteplici interruzioni minori — suggerisce che l'asticella della resilienza per le dipendenze AI debba essere fissata più in alto rispetto ai servizi SaaS tradizionali.
La decisione di Notion di rimuovere tutti i modelli Anthropic il 7 giugno è stata una risposta operativa di routine a un problema infrastrutturale temporaneo. Ma nel contesto di sei disservizi significativi di Claude in circa sei settimane, è anche un segnale molto chiaro: il periodo di grazia in cui l'AI generativa era considerata un esperimento entusiasmante è finito.
Per qualsiasi team che costruisca su Claude — o su qualsiasi modello AI di terze parti — l'ingegneria dell'affidabilità non è più un optional. Logiche di retry, fornitori di backup e un percorso di migrazione dei modelli testato sono il nuovo minimo indispensabile per mantenere vivo un prodotto quando le fondamenta su cui poggia cominciano a tremare.
Comments
0 comments