有一點好緊要,就係同以往某啲轟動一時嘅數據中心死機案唔同,現有證據冇顯示今次後備供電系統(UPS/發電機)有失靈。微軟嘅狀態更新明確指出「數據中心嘅電力已經全面恢復」,即係話問題純粹係最初嘅市電中斷,而唔係現場發電機或者UPS之後再壞。
呢點同Azure其他有記錄嘅事故好唔同。例如2026年2月West US嗰次死機,係因為變電站一個電壓互感器故障,引致瞬間電壓飆升,搞到下游嘅UPS機組損壞,最終成個數據中心完全斷電。 但係喺5月29號呢單嘢,至今都冇報告話發生過類似嘅內部硬件損壞。
一個區域性嘅電力中斷,恢復起嚟係一場漫長嘅拉鋸戰,唔係話撳個掣就搞得掂。根據Azure官方狀態更新,以下係成個事嘅關鍵發展:
今次死機並非個別事件,而係微軟Azure平台困擾多年嘅「天氣相關漏洞」模式嘅最新一單。呢啲事故話畀我哋知,就算最先進嘅雲端基礎設施,最後都係要睇物理世界嘅面色。
呢啲前科同5月29號嘅事件都有個共通點:就係一個外部物理事件直接打中數據中心嘅供電鏈,之後就好似多米諾骨牌咁,引發一大堆依賴佢哋嘅數碼服務連鎖式崩潰。
Azure OpenAI Service 今次榜上有名,意味住呢類死機嘅影響力已經升咗級。 隨住企業愈嚟愈將AI模型嵌入到關鍵工作流程同面向客戶嘅產品入面,區域性雲端死機已經唔單止係IT基建唔方便咁簡單,而係會直接癱瘓到啲AI應用程式、搜尋引擎同自動化流程。就算強雷暴係天災,但今次中斷都突顯咗一個問題:依賴特定雲端區域嘅AI工作負載,風險愈嚟愈集中。
值得留意嘅係,喺現有嘅資料來源入面,微軟暫時仲未就呢次特定事件發布詳細嘅根本原因分析(RCA)。所以,關於電力恢復嘅精確時序,同埋點解某啲儲存單元需要特別長嘅恢復時間,呢啲最終結論都要等官方嘅事後審查報告出爐先可以作實。
Comments
0 comments