AWS本周发出的一封邮件,可能是云计算史上最外交辞令的账单通知。没有解释,没有道歉,没有提及3月1日伊朗无人机袭击摧毁了中东地区两个可用区的事实。只有一句话:3月的费用全免,数据正在处理中,你什么都不会看到。
这不是退款,是抹除。AWS不仅不收钱,还要把整月的计费和使用记录从Cost and Usage Report里删掉。对大多数公司来说,AWS账单不只是发票,而是云基础设施的"唯一真相源"——合规团队靠它审计,FinOps团队用它做成本分析,安全团队查资源分布时也先看账单。3月31日之后,查询2026年3月中东区域的记录,答案将是:空白。什么都没运行过。
3月1日,伊朗对阿联酋的无人机袭击击中了AWS中东(ME-CENTRAL-1)区域的两个可用区。该区域共三个可用区,两毁一存,109项服务中断。客户发现无法通过控制台终止EC2实例——控制平面和底层硬件一起瘫痪了。
AWS的官方博客回应异常简短,短到《金融时报》都觉得受到了冒犯。博客的核心信息是:别指望这个区域短期内恢复可靠运行。没有详细的技术复盘,没有恢复时间表,只有一句"我们正在努力"式的标准措辞。
然后就有了这封账单邮件。 waive(豁免)这个词用得精妙——它暗示一种慷慨,而非对服务未交付的补偿。更精妙的是后半句:处理完成后,Cost Explorer和CUR里不会显示任何3月的使用记录。
这意味着什么?假设你的合规审计在4月进行,审计员要求查看3月中东区域的资源运行证明。你导出CUR,发现该区域整月为零。但CloudTrail日志显示你确实尝试创建过实例,只是失败了。财务系统里可能有手工记录的应急支出。现在你有三个互相矛盾的数据源,而"官方真相"是其中最干净、最不可信的那个。
AWS Resource Explorer是AWS推出的资源清单服务,但至今缺失部分关键资源类型。CUR(Cost and Usage Report,成本与使用报告)仍是多数企业追踪云资产的唯一完整视图。它记录了每个资源ID、运行时长、区域、标签——本质上是云基础设施的会计账本。
FinOps基金会2024年的调研显示,78%的企业将CUR作为云成本管理的主要数据源。合规框架如SOC 2、ISO 27001都要求保留完整的资源运行记录。安全团队调查事件时,CUR是确认"当时有什么在运行"的交叉验证手段。
AWS这次的操作,相当于在账本里撕掉一页,然后告诉你"这页从未存在"。技术上,数据还在后台,只是对账单接口返回零值。但对依赖标准工具的企业来说,效果是一样的:审计轨迹断裂。
一位在金融科技公司负责云治理的工程师向我描述了他的困境:"我们3月在中东有灾备演练计划,部分资源确实启动了,虽然很快失败。现在CUR显示为零,我要怎么向审计解释这笔'不存在'的支出?用邮件截图?"
先停一下。在有人开始写"AWS本该为此做好准备"的爆款文之前,需要厘清责任边界。
可用区的设计容灾目标是设备故障、网络中断、电力问题,而非军事打击。AWS没有常备军队,也无法在战区部署防空系统。要求云服务商抵御物理战争,等同于要求银行金库防核弹——技术上可行,经济上荒谬。
但免责不等于无责。AWS的选择空间很大:可以按实际可用时间比例计费,可以单独标记"战争影响期",可以保留原始记录仅调整金额。它选择了最干净、最省事、最不留痕迹的方式:全免并清零。
这种选择符合AWS的一贯风格。2021年us-east-1大规模中断后,AWS的复盘报告以技术细节著称,但赔偿方案同样简洁——服务积分,无道歉。云计算行业的标准合同(如AWS的SLA)将"不可抗力"定义得极窄,战争通常不在列,但服务商仍保留最终解释权。
区别在于,us-east-1的事件记录完整可查。企业可以分析故障模式,优化架构设计。ME-CENTRAL-1的3月将成为数据黑洞——除非你提前做了外部备份。
这件事的真正影响可能在数年后显现。当企业评估多云策略时,ME-CENTRAL-1会成为一个模糊的案例:我们知道它出过事,但官方记录是空白的。
Google Cloud和Azure在类似区域的布局同样面临地缘风险。AWS的处理方式设定了先例:重大中断可以"账单清零+记录抹除"解决。这对客户是短期利好(省了钱),对行业是长期隐患(失了真)。
一位前AWS产品经理在匿名论坛的评论被高赞置顶:「我们内部讨论过保留标记数据的可能性,结论是'会增加支持成本'。用户会追问'为什么这行是零但下月有费用',不如全删干净。」
这种产品思维很典型:用户投诉 > 数据完整性。当"用户体验"被定义为"不看到令人困惑的信息",真相就成了可牺牲的变量。
回到那封邮件。它的结尾是:"无需您采取任何行动。"确实无需行动——除非你依赖这些数据做决策、做审计、做风险评估。那样的话,你需要在AWS完成"处理"之前,手动导出所有原始记录。
AWS没有告诉你这个选项。它假设所有客户都想要干净的账单,而非完整的真相。这个假设对大部分用户成立,直到它不成立的那一刻。
你的云成本管理系统,有没有做过"AWS突然删除一个月数据"的容灾测试?
热门跟贴