ChatGPT全球宕机90分钟：我们发现了什么？

摸鱼算法

2026-04-24 09:59 ·北京

当8,700名英国用户同时按下刷新键，这场故障暴露了AI基础设施的哪些软肋？

4月20日，全球最受欢迎的聊天机器人经历了一次罕见的"部分宕机"。从美东时间上午10:05开始，Downdetector上的报错报告急剧攀升，英国峰值超过8,700例，美国约1,900例。OpenAI状态页面确认故障持续至少90分钟，涉及登录、对话、语音模式、图像生成等几乎所有核心功能。

但诡异的是：有人完全正常，有人彻底崩溃。TechRadar的AI编辑Graham Barlow反馈网页版可用，只是无法加载历史对话；另一些用户连登录都成问题。这种"薛定谔的宕机"状态，让OpenAI最终将其定性为"性能降级"而非全面瘫痪。

故障时间线：90分钟里发生了什么

美东时间10:05 / 格林尼治时间15:05 —— 第一波警报。

Downdetector监测到异常流量激增。英国报告数迅速突破8,000，美国同期仅约1,875。这种地域差异引发猜测：时区因素？区域服务器配置差异？OpenAI未给出解释。

10:13 —— OpenAI状态页面首次更新，标记为"性能降级"（黄色）。

影响范围几乎全覆盖：对话功能、登录系统、语音模式（语音转文字）、图像生成、嵌入服务（Embedding）、实时API、微调API、GPT-4o、GPT-4、GPT-3.5、o1、o3-mini。连面向开发者的Codex也未能幸免。

11:13 —— 升级至"部分宕机"（红色）。

OpenAI承认"正在继续调查"。此时社交媒体已炸锅。「ChatGPT is down. WTF. I need to work.」——这条推文浓缩了无数用户的焦虑。

约11:35 —— 修复部署完成，进入监控状态。

官方声明称修复"对绝大多数用户有效"，但承认仍在监测恢复情况。部分用户反馈响应延迟、页面空白等问题持续存在。

五个值得玩味的细节

一、英国比美国更"受伤"：数据反常

8,700 vs 1,900的报告比例，与两国用户基数明显倒挂。可能的解释：欧洲服务器集群首当其冲；或美国用户更习惯直接刷新而非上报故障。OpenAI未披露基础设施分布，这成了一道无解题。

二、"部分宕机"的命名艺术

OpenAI的危机公关很精准。不叫"全球瘫痪"，叫"性能降级"；后来升级为"部分宕机"，也留有余地。这种分级体系（绿色/黄色/红色）让用户感知可控，同时为技术团队争取时间。

对比2023年11月那次长达两小时的全面宕机，本次的"部分"定性确实符合事实——有人全程无感。

三、功能解耦的代价

故障清单暴露了一个反常识事实：ChatGPT的"对话"和"登录"是独立模块。有人能登录但无法对话，有人对话正常但看不到历史记录。这种微服务架构提升了日常稳定性，却让故障排查像打地鼠——修好一个，另一个又冒头。

四、语音模式成重灾区

语音转文字（语音模式）和实时API同时挂掉，暗示问题可能出在音频流处理层。这对押注多模态交互的OpenAI不是好消息——GPT-4o的"原生音频"能力刚发布不久，基础设施显然还没跟上野心。

五、Codex的独立命运

有趣的是，部分用户反馈Codex（代码生成工具）工作正常。这暗示OpenAI可能为开发者工具预留了独立资源池，或采用了不同的服务架构。如果是后者，说明其内部正在经历技术栈的分化。

用户依赖度：这次宕机测出的水位

社交媒体上「I need to work」的哀嚎，比任何市场调研都诚实。

ChatGPT已从"尝鲜玩具"变成生产力基础设施。文案、代码、翻译、数据分析——当这些工作流突然中断，用户才发现自己把多少认知外包给了黑箱。

一个细节：本次故障期间，Google Gemini和Claude的搜索热度小幅攀升。但无证据表明出现大规模迁移。用户抱怨归抱怨，忠诚度比想象中高。

这既是OpenAI的护城河，也是它的软肋。护城河在于切换成本：历史对话、自定义指令（Custom Instructions）、GPTs生态，这些沉淀让用户难以说走就走。软肋在于：一旦信任崩塌，反噬也会更剧烈。

技术债务的冰山一角

90分钟修复速度不算慢，但"性能降级"的模糊定义值得警惕。

OpenAI的状态页面更新频率约为每小时一次，在故障高峰期显得滞后。用户被迫在社交媒体互相确认："你那边的ChatGPT好了吗？"这种信息真空，是基础设施成熟度不足的表征。

更深的问题：当一家公司的产品成为数亿人的"外部大脑"，它的故障响应机制是否匹配这种社会权重？

对比云服务商（如AWS）的SLA（服务等级协议）公开承诺，OpenAI对用户几乎没有任何赔偿机制。月付20美元的Plus会员，和免费用户一样只能在状态页面干等。

冷观察

这次宕机最讽刺的注脚：故障期间，有人发现刷新页面时，ChatGPT的报错提示文案写得格外友好——"我们正在努力修复"。

产品团队连崩溃时刻都不忘品牌调性，可惜基础设施团队没能同样给力。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴