Der Stromausfall betraf nicht nur ein oder zwei Dienste. Microsoft meldete eine breite, regionenweite Beeinträchtigung, die einen erheblichen Teil seines Portfolios lähmte. Die offizielle Status-Historie listete unter anderem folgende betroffenen Dienste auf :
Ein wichtiger Punkt zur Klarstellung: Anders als bei einigen berüchtigten Rechenzentrumsausfällen gibt es in den vorliegenden Quellen keine Hinweise darauf, dass die Notstromsysteme bei diesem Ereignis versagt haben. Microsofts Status-Updates erklärten ausdrücklich, dass die „Stromversorgung des Rechenzentrums vollständig wiederhergestellt“ sei, was darauf hindeutet, dass der anfängliche Netzausfall das Problem war und kein anschließender Ausfall der Notstromaggregate oder der unterbrechungsfreien Stromversorgung (USV). Die Beeinträchtigung der Dienste war eine Folge des anfänglichen Stromausfalls und der anschließend benötigten Zeit, um die komplexe Speicher- und Netzwerkinfrastruktur sicher und zuverlässig wieder hochzufahren.
Dies steht im Gegensatz zu anderen dokumentierten Azure-Vorfällen. So führte etwa bei einem Ausfall in der Region „West US“ im Februar 2026 der Defekt eines Spannungswandlers zu einem rapiden Spannungsanstieg, der sich ausbreitete, die USV-Einheiten beschädigte und zu einem vollständigen Stromausfall führte. Für das Ereignis vom 29. Mai wurde kein derartiger interner Hardwarefehler gemeldet.
Die Wiederherstellung nach einem regionenweiten Stromausfall ist ein Marathon, kein Sprint. Basierend auf den offiziellen Azure-Statusaktualisierungen ergibt sich folgender zeitlicher Ablauf der wichtigsten Ereignisse:
Dieser jüngste Ausfall ist keineswegs ein Einzelfall. Er ist Teil eines besorgniserregenden Musters wetterbedingter Schwachstellen, die Microsofts Azure-Plattform seit Jahren plagen. Diese Vorfälle zeigen, dass selbst die hochmodernste Cloud-Infrastruktur letztlich den Gesetzen der physischen Realität unterworfen ist.
Diese Präzedenzfälle haben einen gemeinsamen Nenner mit dem Ereignis vom 29. Mai: Ein externes physisches Ereignis wirkt sich direkt auf die Stromversorgungskette des Rechenzentrums aus und führt zu einem kaskadierenden Ausfall der davon abhängigen digitalen Dienste.
Die Aufnahme des Azure OpenAI Service in die Liste der beeinträchtigten Dienste stellt eine bemerkenswerte Eskalation der Auswirkungen dieser Ausfälle dar. Da Unternehmen KI-Modelle zunehmend in kritische Arbeitsabläufe und kundenorientierte Produkte einbetten, sind regionale Cloud-Ausfallzeiten nicht länger nur eine infrastrukturelle Unannehmlichkeit. Sie stören direkt KI-gestützte Anwendungen, Suchvorgänge und Automatisierungen. Während ein schweres Gewitter höhere Gewalt ist, verdeutlicht der daraus resultierende Ausfall ein wachsendes Konzentrationsrisiko für KI-Workloads, die auf bestimmte Cloud-Regionen angewiesen sind.
Microsoft hatte innerhalb des vorliegenden Quellenzeitraums noch keine detaillierte Ursachenanalyse (Root Cause Analysis, RCA) für diesen speziellen Vorfall veröffentlicht. Daher werden die endgültigen Schlussfolgerungen zur genauen Abfolge der Stromwiederherstellung und dazu, warum bestimmte Speicher-Stamps eine längere Wiederherstellungszeit benötigten, erst mit einem offiziellen Post-Incident-Review bestätigt werden.
Comments
0 comments