Kehilangan daya listrik tidak hanya memengaruhi satu atau dua layanan. Microsoft melaporkan degradasi regional yang luas dan berdampak pada sebagian besar portofolionya. Riwayat status resmi mencatat layanan-layanan berikut terdampak :
Satu poin klarifikasi penting adalah, tidak seperti beberapa gangguan pusat data yang terkenal, tidak ada bukti dari sumber yang tersedia bahwa sistem daya cadangan gagal dalam peristiwa ini. Pembaruan status Microsoft secara eksplisit menyatakan bahwa "daya pusat data telah pulih sepenuhnya," yang menunjukkan bahwa kehilangan daya listrik awal adalah masalahnya, bukan kegagalan berikutnya dari generator di tempat atau Catu Daya Tak Terputus (UPS). Degradasi layanan adalah akibat dari pemadaman listrik awal dan waktu yang diperlukan untuk menghidupkan kembali infrastruktur penyimpanan dan jaringan yang kompleks dengan aman dan andal.
Ini kontras dengan insiden Azure lain yang terdokumentasi. Misalnya, selama pemadaman West US pada Februari 2026, kegagalan transformator tegangan menyebabkan kenaikan tegangan cepat yang merambat ke hilir dan merusak unit UPS, yang menyebabkan hilangnya daya total. Tidak ada kegagalan perangkat keras internal seperti itu yang dilaporkan untuk peristiwa 29 Mei ini.
Pemulihan dari kehilangan daya seluruh kawasan adalah maraton, bukan lari cepat. Berdasarkan pembaruan status resmi Azure, berikut adalah kronologi peristiwa kuncinya:
Gangguan terbaru ini bukanlah insiden terisolasi. Ini adalah bagian dari pola kerentanan terkait cuaca yang mengganggu platform Azure milik Microsoft selama bertahun-tahun. Insiden-insiden ini menunjukkan bahwa bahkan infrastruktur cloud paling canggih pun pada akhirnya bergantung pada realitas fisik.
Preseden ini memiliki benang merah yang sama dengan peristiwa 29 Mei: sebuah peristiwa fisik eksternal secara langsung berdampak pada rantai daya pusat data, yang menyebabkan kegagalan berantai pada layanan digital yang bergantung padanya.
Dimasukkannya Azure OpenAI Service dalam daftar layanan yang terdegradasi menandai eskalasi yang mencolok pada dampak dari gangguan ini. Saat perusahaan semakin menyematkan model AI ke dalam alur kerja kritis dan produk yang berhadapan dengan pelanggan, waktu henti (downtime) cloud regional tidak lagi hanya gangguan infrastruktur. Ini secara langsung mengganggu aplikasi, pencarian, dan otomasi bertenaga AI. Meskipun badai petir parah adalah peristiwa alam, gangguan yang diakibatkannya menyoroti risiko konsentrasi yang berkembang untuk beban kerja AI yang bergantung pada wilayah cloud tertentu.
Hingga saat ini, Microsoft belum menerbitkan Analisis Akar Masalah (Root Cause Analysis/RCA) yang terperinci untuk insiden spesifik ini dalam cakupan sumber yang disediakan. Dengan demikian, kesimpulan akhir tentang urutan pemulihan daya yang tepat dan mengapa stempel penyimpanan tertentu memerlukan waktu pemulihan yang lama hanya akan dikonfirmasi dengan tinjauan resmi pasca-insiden.
Comments
0 comments