投诉类型的分布也清晰地勾勒出了问题轮廓:
这是一次全球范围的扰动,但在几个关键地区表现得尤为集中。多份报告确认,美国、印度、菲律宾、波黑、爱尔兰和英国是重灾区,此外也有来自其他国家的零星反馈。与过去几乎所有重大宕机事件一致,免费版用户和支付20美元月费的ChatGPT Plus用户同样无法幸免
。
这次宕机的破坏力尤其体现在时间点上。周五上午正值美洲和欧洲专业人士使用ChatGPT进行文稿撰写、代码生成、数据分析及内容创作的高峰窗口。哪怕是短短两小时的中断,对于已将工作流深度绑定在平台上的团队而言,也是一记实打实的生产力暴击。
按照OpenAI近年的“标准”来看,6月5日事件只能算中等规模,但它是一个令人不安的趋势的延续。在过去的12个月里,ChatGPT至少经历了6至8次引起广泛关注的宕机,其中几次无论是持续时间还是用户影响都严重得多。
相比之下,6月5日这次约2小时、投诉量中等的故障,在持续时间和影响规模上都不及上述最严重的几次事件。但这并不意味着它可以被轻视。这类事件大约每六到八周就“准时到访”一次,这暗示的不是运气不好,而是一个系统性的可靠性难题。
每当ChatGPT宕机,都在重复同一个不那么让人舒服的事实:整个AI行业已经围绕一个基础设施建起了“公用事业”级别的依赖,而这套基础设施有时候仍像一家初创公司那样脆弱。后果远不止是几小时的不便。
单点故障式依赖是第一层也是最直接的风险。如今,数百万专业人士、学生和企业已经把ChatGPT当作日常关键基础设施。当它宕机时,所有依赖OpenAI特定模型、上下文窗口以及第三方集成的流水线只能干等。不存在一个通用的Plan B 。
反复无常的稳定性已非“成长的烦恼”,而是有据可查的现实。OpenAI的官方在线率指标显示,2026年3至6月期间,ChatGPT为99.83%,API为99.98%,但这个数字掩盖了一个真相——一旦发生故障,往往就是全局性的、长时间的或者扎堆出现的。对于一项越来越像水、电一样支撑知识工作的服务来说,低于四个九(99.99%)甚至五个九(99.999%)的关键基础设施可靠性标准,就意味着用户随时可能“裸奔”。
不透明的信息披露放大了问题。OpenAI经常不在第一时间披露具体的根本原因。6月5日事件发生时,没有发出任何正式声明。而当事后报告出现时,往往只针对重大事件。例如,2024年12月一场持续4小时10分钟的宕机,事后被追溯到一个看似不起眼的配置变更——正是它把工程师锁在了关键控制台之外,无法及时止损
。2025年12月那场跨日中断则被归结为“路由配置错误”
。这些细节对评估业务风险的企业至关重要,但它们往往来得太迟,无法为运营决策提供有效参考。
共享基础设施的“传染”风险,是那种直到出事才被想起来的隐患。2025年11月Cloudflare那次“团灭”证明,ChatGPT的可靠性不完全是OpenAI自家的事。当关键互联网基础设施供应商出了问题,跑在上面的所有集中式AI服务都可能同步瘫痪。ChatGPT、X、Canva以及雅虎的多项服务一起倒下。这让整个AI生态系统的抗风险能力,比任何一家厂商单独提供的在线数字都来得更脆弱。
付费壁垒并不存在。 每月支付20美元的ChatGPT Plus用户,经历着和免费用户完全一样的宕机。在2025年6月的故障中,两大用户群跨越各大洲被同步“拒签”。对那些考虑签订企业级合同的商业客户来说,如果在消费者付费层面都看不到差异化的可靠性,那么服务等级协议(SLA)里究竟有多少保障,就得打个问号了。
没有冗余的深度绑定才是结构性的困局。用户不可能在宕机时无缝切换到另一个性能相当的服务,因为每个平台都有各自独特的模型能力、自定义GPT、对话历史和工作流集成。迁移摩擦——哪怕是临时的——如此之大,以至于绝大多数用户宁愿等它恢复,也不愿折腾着把工作搬运到别处。这就造就了一种最坏的处境:严重依赖,却没有真正意义上的故障转移能力。
所有这些事件拼凑出的,是一个AI行业尚未度过的“成熟期阵痛”。集中式、强依赖云端的交付方式仍是大部分主流AI模型的默认架构,但每次重大宕机,都在为那些分布式、可互操作、具备离线能力的替代方案增加几分说服力。在那一天到来之前,全世界最先进AI工具的可靠性,仍将悬系于少数几个机房里是否灯火通明。
Comments
0 comments