Max Schoening, Produktleiter von Notion, bestätigte, dass der Zugriff auf die Anthropic-Modelle etwa 12 Stunden nach Beginn der Störung wiederhergestellt wurde. Er beschrieb das Ereignis als eine übliche, vorübergehende Dienstunterbrechung und merkte an, dass solche Vorfälle bei jeder großen Plattform vorkommen, auch bei Notion selbst, GitHub und AWS .
Ein Sprecher von Anthropic führte das Problem auf „ein kurzes Infrastrukturproblem" zurück, das für kurze Zeit zu erhöhten Fehlern bei mehreren Claude-Modellen führte, und bestätigte, dass das Problem behoben wurde .
Notion hat nicht öffentlich gemacht, welche alternativen KI-Anbieter den umgeleiteten Datenverkehr aufgefangen haben. Die Maßnahme des Unternehmens war jedoch eindeutig: Sobald die Opus-Modelle von Anthropic fehlerhafte Ergebnisse lieferten, entfernte das System von Notion automatisch alle Anthropic-Modelle aus der nutzerseitigen Modellauswahl und leitete die Anfragen anderweitig weiter .
Dies ist ein konkretes Beispiel für eine Multi-Modell-Failover-Architektur in Aktion. Anstatt zuzulassen, dass sich nutzerseitige Ausfälle ausweiten, während man auf die Wiederherstellung bei Anthropic wartet, behandelte Notion die KI-Modellschicht als austauschbare Komponente – so wie ein Cloud-Architekt eine ausfallende Datenbank oder ein nicht reagierendes CDN behandeln würde.
Isoliert betrachtet war die Störung vom 7. Juni geringfügig, aber sie ereignet sich inmitten einer Häufung von Claude-Vorfällen, die das Vertrauen in die Zuverlässigkeit der Plattform erschüttert haben.
Die schwerwiegendste Störung ereignete sich am 2. Juni, als ein größerer Ausfall Claude.ai, die API, die Claude Console und Claude Code betraf. Erhöhte Fehlerraten wurden bei Opus 4.6 und anderen Modellen gemeldet, wobei die Nutzerberichte auf Downdetector gegen 02:10 Uhr ET / 07:10 Uhr GMT in die Höhe schnellten. Die gesamte Störung dauerte fast sechs Stunden, bevor die Dienste vollständig wiederhergestellt waren .
Nur drei Tage später, am 5. Juni, war die Claude-Plattform von Anthropic erneut offline. Die Status-Seite verzeichnete von 15:08 Uhr UTC bis 18:28 Uhr UTC „erhöhte Fehler bei vielen Claude-Modellen", wobei Opus 4.7 und 4.8 sich zuletzt erholten. Der Vorfall nahm eine ernstere Wendung, als Nutzer nach dem Ausfall Antworten bemerkten, die offenbar aus anderen Sitzungen stammten, was Anthropic dazu veranlasste, eine formelle Untersuchung wegen eines möglichen Datenlecks einzuleiten .
Ein kürzerer Vorfall am 6. Juni betraf claude.ai, die Konsole und die API. Opus 4.8 zeigte etwa 50 Minuten lang eine eingeschränkte Leistung, bevor ein Fix implementiert und überwacht wurde .
Diese jüngste Häufung kam nicht aus heiterem Himmel. Für Opus 4.7 wurden bereits am 22. und 25. Mai Zeitfenster mit erhöhten Fehlern protokolliert, und etwa eine Woche nach dem Start des Modells am 16. April war von Entwicklern ein Qualitätsverlust dokumentiert worden – ein Muster, das den Problemen mit Opus 4.6 im März glich .
Im April 2026 räumte Anthropic öffentlich einen Qualitätsverlust bei Claude Code, Claude Agent SDK und Claude Cowork zwischen dem 4. März und dem 20. April ein, führte dies auf drei verschiedene Ursachen zurück und setzte nach der Obduktion die Nutzerbeschränkungen zurück .
Für Unternehmen, die Claude als Kernbestandteil ihres Produkts nutzen, hält der Notion-Vorfall vom 7. Juni eine einfache Lektion bereit: Die Abhängigkeit von einem KI-Modell eines Drittanbieters ist jetzt ein Infrastrukturrisiko, gegen das technisch vorgesorgt werden muss.
Ein Produktionssystem, das ein einziges Anthropic-Modell aufruft, benötigt drei verschiedene Fähigkeiten: eine Wiederholungsstrategie für vorübergehende 5xx- oder 529-Fehler, ein Ersatzmodell, um Dienstunterbrechungen abzufangen, und einen Migrationsplan für längerfristige Qualitätsverluste oder die Abkündigung von Modellen. Sich nur auf eine dieser Strategien zu verlassen, ist unzureichend .
Die automatische Deaktivierung aller Anthropic-Modelle durch Notion und die nahtlose Umleitung an alternative Anbieter ist genau das Muster, das immer mehr nachgelagerte Integratoren übernehmen müssen. Ohne ein Multi-Modell-Failover kann selbst ein 50-minütiges Fenster mit eingeschränkter Leistung zu kundenwirksamen Ausfällen bei Support-Bots, Datenpipelines und Tools zur Entwicklerproduktivität führen .
Die eigenen 90-Tage-Verfügbarkeitszahlen von Anthropic weisen 98,8 % für claude.ai und 99,15 % für die Claude API aus . Diese Zahlen sehen in absoluten Werten vernünftig aus, spiegeln aber eine Plattform wider, die viele Unternehmen inzwischen als Tier-1-Infrastruktur behandeln. Die Häufung von Vorfällen Anfang Juni 2026 – ein sechsstündiger globaler Ausfall, ein dreistündiger Ausfall mit Datenleck-Untersuchung und mehrere kleinere Störungen – legt nahe, dass die Messlatte für die Resilienz von KI-Abhängigkeiten höher angesetzt werden muss als für traditionelle SaaS-Dienste.
Die Entscheidung von Notion, am 7. Juni alle Anthropic-Modelle zu entfernen, war eine routinemäßige operative Reaktion auf ein vorübergehendes Infrastrukturproblem. Angesichts von sechs nennenswerten Claude-Störungen in etwa sechs Wochen ist es jedoch auch ein klares Signal: Die Schonfrist, in der generative KI als spannendes Experiment behandelt wurde, ist vorbei.
Für jedes Team, das auf Claude – oder ein anderes KI-Modell eines Drittanbieters – aufbaut, ist Zuverlässigkeits-Engineering nicht länger optional. Wiederholungslogik, Ersatzanbieter und ein getesteter Migrationspfad für Modellversionen sind die neuen Mindestvoraussetzungen, um ein Produkt am Leben zu erhalten, wenn das Fundament darunter zu wackeln beginnt.
Comments
0 comments