事件的規模本身就提供了最有利的線索。六項架構上各自獨立的服務——涵蓋推論、影像與影片生成、程式碼執行及身分管理——在同一時間點全部失效,這強烈暗示是某個共用的基礎層發生崩潰。分析師推測,故障點很可能出在核心 API 閘道、調度主幹或集中式身分驗證提供者,而非單一模型故障 。然而,在欠缺官方證實前,這仍然是合理的推測。
這起當機事件引發了大量用戶通報。全球各地的 Downdetector 收到超過 5,000 件投訴,其中逾 4,300 件來自美國 。無論是透過網頁、行動應用程式或桌面版,所有平台的使用者都回報被完全鎖在系統之外
。
印度是受創最重的地區之一。該國擁有全球數一數二的 ChatGPT 用戶群,來自印度的當機通報數量相當可觀 。儘管截稿時尚未有印度在此特定日期的精確 Downdetector 獨立統計數據,但從過往模式來看,OpenAI 重大當機事件通常會在印度引發 500 到 900 件以上的用戶投訴,而本次事件被形容為「全球大規模,包含印度在內」
。
除了消費端的衝擊,這起當機也讓 API 企業客戶無所適從。在 OpenAI 基礎架構上運行正式環境的開發者,完全等不到官方的根因說明、影響評估或預計復原時間 。由於 OpenAI 至今仍未提供正式的公開 SLA(服務水準協定,一種對正常運行時間的正式保證),企業風險管理人員被迫在缺乏故障分析的情況下,做出基礎架構決策,難以評估事件重演的機率
。
5 月 29 日的事件並非單一偶發事故,而是 2026 年一系列當機事件的最新一頁,持續考驗著用戶與企業的信心:
這種模式已成為可被量化的可靠性落差。一份涵蓋 2025 年底至 2026 年初的 Nordic APIs 可靠性報告,將 AI 與 ML API 的運行時間列為所有類別的最後一名,而光是在 2026 年 1 月的 28 天內,OpenAI 就記錄到 11 起獨立事故——大約每 2.5 天就發生一起 。在過去 12 個月內,OpenAI 與 Anthropic 都難以維持 99% 的可用性,這個標準仍然意味著一年會有超過 3.5 天的停機時間,相較之下,主要雲端服務供應商的平均運行時間則約為 99.97%
。
可靠性問題正處於一個對 OpenAI 極其不利的時間點。該公司近期未能達成新用戶與營收目標,虧損預計在年底將達到 170 億美元 。即便 OpenAI 的消費者用戶數遠超過 Anthropic,Anthropic 在 2026 年 4 月的年化營收已達約 300 億美元,超越了 OpenAI 截至 2026 年 2 月的約 250 億美元
。Google 的 Gemini 在企業端也持續獲得市場關注,讓競爭壓力更為緊繃
。
Anthropic 本身也存在嚴重的可靠性問題,包含 2026 年 4 月一次長達十小時的 Claude 當機,以及幾天後的另一起事故 。但 OpenAI 在 5 月 29 日的故障更為全面——是所有服務的同步崩潰——而長期缺乏公開 SLA 一事,也日益被視為迴避風險的企業買家在選擇供應商時的關鍵區別
。產業分析已開始積極建議,2026 年的採購防禦姿態,應採用具備故障切換機制的多供應商路由,而非仰賴任何單一的 AI API 供應商
。
5 月 29 日當機事件後,仍有幾個重大疑問懸而未解:
在 OpenAI 釋出詳盡的分析報告前,5 月 29 日的大當機對於任何將關鍵工作流程建構在該公司基礎架構上的組織來說,都將是一記警鐘。
Comments
0 comments