北京时间 3 月 2 日晚 19:49,Claude 崩了。

截止到本文发出时(次日 16:24),网页端仍然没有完全恢复。

网页版弹出“Claude is currently experiencing a temporary service disruption”,客户端登录失败,Console 报 500 错误。高峰时近 2000 名用户同时报障。消息迅速传开,社交媒体上一片哀嚎。

与此同时,另一条新闻正在刷屏:伊朗无人机炸了 AWS 在阿联酋的数据中心

两件事撞到一起,一个极具戏剧性的叙事立刻成型——“AWS 中东机房被炸,Claude 跟着一起挂了!”媒体争相报道,连 Bloomberg 都出了快讯。全球程序员瑟瑟发抖,纷纷感叹“第三次世界大战先打掉了我的 AI 编程助手”。

打开网易新闻 查看精彩图片

但这个叙事,大概率是错的

事实一:到底什么挂了,什么没挂?

这是分析问题的起点,也是绝大多数人没搞清楚的关键。

Anthropic 在事故发生后明确确认:Claude API(api.anthropic.com)工作正常。出问题的是:

打开网易新闻 查看精彩图片

注意这个模式:后端模型推理没挂,前端界面和认证系统挂了

Claude Code 的情况比较微妙——它本身走的是 API 通道,但在认证、会话管理等环节依赖了前端基础设施,所以出现了“错误率升高”但并非完全不可用的症状。如果你在故障期间用的是直接调 API 的方式,你甚至可能完全没感知到这次事故。正好比老冯这篇文章,正是使用 Claude Code 进行事实核查的。

这是一个非常重要的线索。这更像“认证与流量入口先爆,再向后扩散”,不是“核心推理集群被物理摧毁”。

事实二:AWS 中东被炸了什么?

我在另一篇分析中已经详细梳理过,这里简要回顾。

3 月 1 日,伊朗对阿联酋和巴林发射无人机/导弹,AWS 在中东的数据中心遭遇直接打击:

UAE(me-central-1):3 个可用区中 2 个瘫痪(mec1-az2 被直接命中起火,mec1-az3 连锁断电)•Bahrain(me-south-1):3 个可用区中 1 个受损(mes1-az2 附近打击造成物理损伤)•Israel(il-central-1):未受影响

打开网易新闻 查看精彩图片

中东 9 个运营可用区里挂了 3 个,占比 33%。UAE 区域丧失 2/3 容量。这确实是 AWS 历史上前所未有的物理灾难——人类第一次用导弹无人机打掉了云计算基础设施。但问题来了:Anthropic 的服务跑在中东吗?

事实三:Claude 不在中东

问题的关键在于,Anthropic 是一家总部位于旧金山的 AI 公司。Claude 的模型推理集群,需要的是大规模 GPU 算力——H100/H200 集群。这些资源部署在 AWS 的 us-east-1(弗吉尼亚)、us-west-2(俄勒冈)等美国本土核心区域,而不是中东。

AWS 中东区域(me-central-1、me-south-1)是面向中东本地客户的区域服务节点。这些区域主要服务于中东地区的企业客户,部署的是标准的云计算服务(EC2、S3、RDS 等),而非大规模 AI 推理集群。

AWS 官方故障隔离文档写得很直白:Region 之间相互隔离,单 Region 故障原则上不应拖垮其他 Region。

如果 Claude 的核心推理引擎跑在中东,那 API 应该也挂了。 但 API 完全正常——这直接否定了“导弹打掉 Claude 后端”的假说。有人可能会说:“也许 AWS 在全球做了流量重路由,导致其他区域过载?”理论上存在这种可能,但如果是后端过载,受影响的应该是 API 响应速度和可用性,而不是前端的登录认证系统。而实际表现恰恰相反——API 没事,前端认证挂了。

真正的原因:成功税

那么,真正的原因可能是什么呢?

让我们把时间线往前拨 48 小时,看看 3 月 2 日之前发生了什么。

五角大楼风波

2 月底,一场政治风暴席卷了 AI 行业:

1.五角大楼要求 Anthropic 开放模型用于军事用途(包括自主武器和监控系统),被 Dario Amodei 拒绝2.特朗普政府将 Anthropic 列为“激进左翼 AI 公司”,下令联邦机构 6 个月内停用3.国防部长 Hegseth 将 Anthropic 定性为“供应链安全风险”4.OpenAI 随即签下 2 亿美元五角大楼合同,接过了 Anthropic 拒绝的生意

这在普通消费者中引发了剧烈反应。

战争部长说这是 “企业道德作秀”,但不得不说这个秀的效果确实极好。

用脚投票

2 月 28 日:ChatGPT 美国卸载量暴涨 295%(正常日环比仅 9%)•2 月 28 日:Claude 下载量环比增长 51%2 月 28 日:Claude 历史上首次在美国 App Store 下载量超过 ChatGPT,登顶第一•此前 Claude 在 App Store 排名第 42 位(超级碗广告后)•2026 年以来,Claude 免费活跃用户增长 60%,日注册量 翻了四倍

Reddit 和 X 上掀起了 “ 运动。用户自发撰写从 ChatGPT 迁移到 Claude 的教程。一场史无前例的 AI 产品“用脚投票”正在发生。

打开网易新闻 查看精彩图片

然后 Claude 就挂了

从 App Store 第 42 名到第 1 名。日注册量翻四倍。海量新用户在同一个周末涌入。

任何系统工程师看到这组数字,都知道接下来会发生什么。

前端服务——Web 界面、认证系统、会话管理——这些不是按照“突然涌入几倍用户”来设计容量的。后端 GPU 推理集群可以通过排队和限流来扛住压力,但前端的登录、Session 管理、WebSocket 连接等服务,面对的是瞬时并发的冲击。

这完美解释了为什么:

API 没挂(API 用户量相对稳定,且本来就有限流机制)•前端挂了(海量新用户涌入 claude.ai 注册/登录)•Claude Code 部分受影响(依赖前端认证链路,但核心推理走 API)•Claude for Government 没事(独立部署,用户量不受消费级市场波动影响)

时间线对不上

再看时间线:

打开网易新闻 查看精彩图片

AWS 中东事件从 3 月 1 日凌晨就开始了。如果 Claude 的故障与之相关,为什么延迟了 27 个小时才出现?而且出现的不是后端推理故障,而是前端认证崩溃?

更合理的时间线是:经过一个周末的病毒式传播,周一(3 月 2 日)工作日开始,全球用户密集上线,前端系统在北京时间周一晚(美东周一早晨)迎来峰值流量,然后——扛不住了。

11:49 UTC 恰好是美东早上 6:49——美国东海岸用户开始新一天工作的时间。这不是巧合。

Anthropic 自己怎么说?

Anthropic 官方在事后表示,公司过去一周一直在应对 “unprecedented demand”(前所未有的需求)

这句话本身就是答案。他们没提 AWS 中东,没提导弹,没提区域故障。他们说的是——需求太大了

这是一个好问题。甚至可以说,这是你能遇到的最好的问题之一。

在基础设施运维的世界里,有两种宕机:

1.需求不足导致的宕机:没人用你的服务,但它还是挂了——这说明你的系统质量有问题2.需求过载导致的宕机:太多人想用你的服务——这说明你的产品太成功了

Claude 遇到的是第二种。这不是一个工程灾难,这是一个 成功税(Success Tax)

当然,“成功税”不代表可以不交。Anthropic 的前端基础设施在面对用户激增时的脆弱性暴露无遗。这也给所有 AI 公司上了一课:

前端和认证系统的弹性扩展同样关键——不是只有 GPU 集群需要弹性•消费级产品的流量特征与 API 完全不同——API 增长是线性的,消费级产品可能是指数的•政治事件可以在 48 小时内改变用户规模的数量级——这是传统容量规划无法预见的

截至发稿:仍在波动

截至北京时间 3 月 3 日,Claude 的状态页显示仍有活跃事故:

06:59 UTC:Claude Opus 4.6 出现 elevated errors(正在调查)•03:15 - 04:43 UTCclaude.ai、cowork、platform、Claude Code 出现 elevated errors

打开网易新闻 查看精彩图片

服务在恢复与波动之间反复。这符合“容量不足逐步扩容”的特征,而不是“物理设施被毁等待重建”的特征。如果是后者,恢复曲线不会是这种渐进式的。

结论

AWS 中东数据中心被伊朗无人机炸了,这是事实。Claude 全球大宕机,这也是事实。但把这两件事画等号——那是在偷懒。

证据链清晰地指向一个判断:Claude 的故障本质上是一次 容量过载事故,诱因是 OpenAI 五角大楼合同引发的大规模用户迁移。从 App Store 第 42 名到第 1 名,日注册量翻四倍——没有几个前端系统能在 48 小时内毫无准备地接住这种冲击。

导弹炸的是机房,挂的是中东客户的 EC2 和 S3。用户洪流冲的是登录页面,挂的是 claude.ai 的认证系统。

两件事,两个原因,两条因果链。恰好撞在了同一个周末。

对 Anthropic 来说,这反而是一个微妙的好消息:你的竞争对手(OpenAI)帮你做了你自己花多少钱都买不来的用户增长。代价只是一次前端宕机和一个尴尬的周末。

这个故障,恐怕 Dario Amodei 做梦都会笑醒。

声明:本文碳基智力含量:约 20% References

[1] Anthropic confirms Claude is down in a worldwide outage - BleepingComputer:https://www.bleepingcomputer.com/news/artificial-intelligence/anthropic-confirms-claude-is-down-in-a-worldwide-outage/
[2]Anthropic's Claude Chatbot Goes Down For Thousands of Users - Bloomberg:https://www.bloomberg.com/news/articles/2026-03-02/anthropic-s-claude-chatbot-goes-down-for-thousands-of-users
[3]ChatGPT uninstalls surged by 295% after DoD deal - TechCrunch:https://techcrunch.com/2026/03/02/chatgpt-uninstalls-surged-by-295-after-dod-deal/?type=AI
[4]Claude beats ChatGPT in U.S. app downloads - Axios:https://www.axios.com/2026/03/01/anthropic-claude-chatgpt-app-downloads-pentagon
[5]Anthropic's Claude overtakes ChatGPT in App Store - Fortune:https://fortune.com/2026/03/02/anthropic-claude-dario-amodei-number-one-app-store-openai-chatgpt-sam-altman-department-war/
[6]AWS says drones hit two of its datacenters in UAE - The Register:https://www.theregister.com/2026/03/02/amazon_outages_middle_east/
[7]Claude Goes Down Globally as AWS Data Centers Burn - Awesome Agents:https://awesomeagents.ai/news/claude-outage-march-2026-aws-middle-east/
[8]Claude Status Page:https://status.claude.com/
[9]Why Is Claude Not Working? - Techloy:https://www.techloy.com/why-is-claude-not-working-everything-we-know-about-the-anthropic-outage/
[10]AWS Global Infrastructure: https://aws.amazon.com/about-aws/global-infrastructure/regions_az/

专栏:云计算泥石流

云故障

云资源

下云记