今次事故嘅規模本身就係最大嘅線索。六套架構上互相獨立嘅服務——涵蓋推理、圖像同影片生成、程式碼執行同身份管理——喺同一刻一齊死,強烈暗示係底層共享基礎架構出事。有分析師就推斷,可能係核心 API 閘道、編排主幹(orchestration backbone)或者中央認證系統跪低,而唔係個別模型有 bug 。不過,一日未有官方確認,呢啲都只係有根據嘅猜測。
呢次死機引發大量用戶報告。全球嚟講,Downdetector 收到超過 5,000 宗投訴,其中超過 4,300 宗來自美國 。無論係用網頁瀏覽器、手機 App 定係桌面版嘅用戶,都話自己完全被鎖咗出去
。
印度係其中一個重災區。當地係全球 ChatGPT 用戶最多嘅地區之一,而今次死機報告數量相當龐大 。雖然發稿時未有印度獨立嘅、精準嘅 Downdetector 數據,但根據過往模式,OpenAI 每次大型死機,印度慣例上都會錄得 500 到超過 900 宗投訴,而今次事故就被形容為「全球大規模,包括印度在內」
。
呢次死機唔單止影響普通用戶,更令企業 API 客戶無所適從。嗰啲喺 OpenAI 基建上運行緊生產工作負載(production workloads)嘅開發者,得唔到任何官方嘅根因分析、影響評估或預計恢復時間 。OpenAI 至今都冇提供一個正式嘅服務水平協議(SLA,即係保證服務上線時間嘅正式承諾),喺冇呢份嘢嘅情況下,企業風險管理人員焗住要喺欠缺故障分析嘅情況下,去判斷同決定自己嘅基建部署,仲要自己評估事件重演嘅機會率
。
5 月 29 日嘅事故並唔係單一事件。佢只係 2026 年一連串可靠性事故嘅最新一單,呢啲事故不斷測試緊用戶同企業嘅信心:
呢種模式已經變成一個可量化嘅可靠性差距。一份涵蓋 2025 年底到 2026 年初嘅《Nordic APIs 可靠性報告》,將 AI 同 ML 類別嘅 API 喺上線時間可靠性方面排到榜尾。而 OpenAI 喺 2026 年 1 月就單獨錄得 11 次事故——大約每 2.5 日就一單 。喺過去 12 個月,OpenAI 同 Anthropic 兩間公司都掙扎住維持 99% 嘅可用性(呢個標準本身就代表每年有超過三日半嘅死機時間),相比之下,主要雲端服務供應商平均做到約 99.97% 嘅上線時間
。
對 OpenAI 嚟講,可靠性問題喺呢個時候加劇,真係衰得不是時候。公司最近喺新用戶數同收入方面都未能達標,預計去到年底,虧損將高達 170 億美元 。雖然 OpenAI 嘅消費者用戶基數遠超 Anthropic,但 Anthropic 喺 2026 年 4 月嘅年度化收入約為 300 億美元,超越咗 OpenAI 截至 2026 年 2 月嘅約 250 億美元
。Google 嘅 Gemini 喺企業市場亦越做越有,進一步收緊競爭嘅包圍網
。
Anthropic 自己都有嚴重嘅可靠性問題,包括 2026 年 4 月 Claude 死機十個鐘頭,幾日後又再出事 。但 OpenAI 5 月 29 日嘅死機更加全面——係所有服務同時一鑊熟——而且佢哋死都唔肯出一個公開嘅 SLA,呢點越來越被認為係風險規避型企業買家眼中嘅關鍵差異化因素,當然係負面嗰種
。行業分析而家都積極建議,2026 年企業喺採購上最穩陣嘅做法,係採用多供應商路由(multi-provider routing)並制訂好故障轉移(failover)程序,而唔係依賴任何單一 AI API 供應商
。
5 月 29 日死機之後,仲有幾個重大疑問未有答案:
喺 OpenAI 出詳細分析之前,5 月 29 日嘅死機事故,對任何打算喺佢哋基建上建立關鍵工作流程嘅機構嚟講,都會係一個警示訊號。
Comments
0 comments