Szef produktu w Notion, Max Schoening, potwierdził, że dostęp do modeli Anthropic został przywrócony około 12 godzin po rozpoczęciu zakłócenia. Opisał to zdarzenie jako standardowe tymczasowe zakłócenie usługi, zaznaczając, że takie incydenty zdarzają się każdej dużej platformie — również Notionowi, GitHubowi czy AWS .
Rzecznik Anthropic przypisał problem „krótkiej awarii infrastruktury”, która spowodowała podwyższony poziom błędów w wielu modelach Claude przez krótki czas, i potwierdził, że problem został rozwiązany .
Notion nie ujawnił publicznie, którzy alternatywni dostawcy AI przejęli przekierowany ruch, ale działanie firmy było jednoznaczne: w momencie, gdy modele Opus Anthropic zaczęły zwracać wyniki o obniżonej jakości, system Notion automatycznie usunął wszystkie modele Anthropic z listy dostępnych dla użytkowników modeli i przekierował żądania gdzie indziej .
To konkretny przykład architektury wielodostawcowego przełączania awaryjnego (ang. multi-model failover) w działaniu. Zamiast pozwolić, by awarie widoczne dla użytkownika kaskadowo narastały w oczekiwaniu na naprawę Anthropic, Notion potraktował warstwę modeli AI jak wymienny komponent — podobnie jak architekt chmury traktuje niedziałającą bazę danych czy nieodpowiadający CDN.
Zakłócenie z 7 czerwca, rozpatrywane osobno, było drobne. Ale wypada ono w sam środek fali incydentów z Claude’em, które zachwiały zaufaniem do niezawodności platformy.
Najpoważniejsze zakłócenie uderzyło 2 czerwca, gdy duża awaria dotknęła Claude.ai, API, Claude Console i Claude Code. Podwyższoną stopę błędów zgłaszano w Opus 4.6 i innych modelach, a zgłoszenia użytkowników na Downdetector gwałtownie wzrosły około 02:10 ET / 07:10 GMT. Całkowite zakłócenie trwało prawie sześć godzin, zanim usługi w pełni przywrócono .
Zaledwie trzy dni później, 5 czerwca, platforma Claude Anthropic ponownie przestała działać. Strona statusowa odnotowała „podwyższone błędy w wielu modelach Claude” od 15:08 UTC do 18:28 UTC, przy czym Opus 4.7 i 4.8 wracały do normy jako ostatnie. Incydent nabrał poważniejszego wymiaru, gdy użytkownicy zgłosili, że po awarii otrzymali odpowiedzi wyglądające na pochodzące z sesji innych osób, co skłoniło Anthropic do wszczęcia formalnego dochodzenia w sprawie potencjalnego wycieku danych .
Krótszy incydent 6 czerwca dotknął claude.ai, konsolę i API. Opus 4.8 doświadczał obniżonej jakości usługi przez około 50 minut, zanim wdrożono i monitorowano poprawkę .
Ten najnowszy klaster incydentów nie wziął się znikąd. Opus 4.7 notował już okna z podwyższoną liczbą błędów 22 i 25 maja, a regresję jakościową udokumentowali deweloperzy około tygodnia po premierze modelu 16 kwietnia — schemat, który powtórzył problemy z Opus 4.6 z marca .
W kwietniu 2026 r. Anthropic publicznie przyznał się do spadku jakości w Claude Code, Claude Agent SDK i Claude Cowork między 4 marca a 20 kwietnia, przypisując go trzem odrębnym przyczynom, i po opublikowaniu analizy pośmiertnej przywrócił wcześniejsze ograniczenia użytkowników .
Dla firm, które polegają na Claude’u jako kluczowym elemencie swojego produktu, incydent z Notionem z 7 czerwca niesie prostą lekcję: zależność od modelu AI zewnętrznego dostawcy stała się ryzykiem infrastrukturalnym i trzeba je odpowiednio inżynieryjnie zabezpieczyć.
System produkcyjny, który wywołuje pojedynczy model Anthropic, potrzebuje trzech odrębnych zdolności: strategii ponawiania dla przejściowych błędów 5xx lub 529, modelu zapasowego na wypadek przerw w dostawie usługi oraz planu migracji na wypadek długoterminowej regresji jakościowej lub wycofania modelu. Poleganie tylko na jednej z nich jest niewystarczające .
Automatyczne wyłączenie przez Notion wszystkich modeli Anthropic i płynne przekierowanie żądań do alternatywnych dostawców to dokładnie ten wzorzec, który będzie musiało wdrożyć więcej integratorów. Bez wielodostawcowego failover nawet 50-minutowe okno obniżonej wydajności może przerodzić się w awarie widoczne dla klientów — w botach wsparcia, potokach danych czy narzędziach zwiększających produktywność programistów .
Własne 90-dniowe dane Anthropic pokazują 98,8% dostępności dla claude.ai i 99,15% dla Claude API . Choć liczby te wyglądają rozsądnie w wartościach bezwzględnych, odzwierciedlają stan platformy, którą wiele firm traktuje dziś jako infrastrukturę pierwszej kategorii (tier-1). Skupienie incydentów na początku czerwca 2026 r. — sześciogodzinna globalna awaria, trzygodzinna awaria z dochodzeniem w sprawie wycieku danych i kilka mniejszych zakłóceń — sugeruje, że poprzeczkę odporności dla zależności AI należy ustawić wyżej niż dla tradycyjnych usług SaaS.
Decyzja Notion o wyłączeniu wszystkich modeli Anthropic 7 czerwca była rutynową odpowiedzią operacyjną na tymczasowy problem z infrastrukturą. Jednak w kontekście sześciu zauważalnych zakłóceń Claude’a w ciągu mniej więcej sześciu tygodni jest to również wyraźny sygnał: okres ochronny, w którym generatywną AI traktuje się jako ekscytujący eksperyment, dobiegł końca.
Dla każdego zespołu budującego na Claude’u — lub na jakimkolwiek zewnętrznym modelu AI — inżynieria niezawodności przestała być opcją. Logika ponawiania żądań, zapasowi dostawcy i przetestowana ścieżka migracji modeli to dziś nowe wymagania podstawowe, by utrzymać produkt przy życiu, gdy fundament pod nim zaczyna się chwiać.
Comments
0 comments