打开网易新闻 查看精彩图片

2026 年 3 月 1 日至 2 日,AWS 在中东 ME-CENTRAL-1 区域发生了大规模服务中断。

打开网易新闻 查看精彩图片

根据 AWS 的官方通告,当地时间 3 月 1 日凌晨,大约在PST 04:30 左后,ME-CENTRAL-1 区域的mec1-az2可用区的一处数据中心遭到不明物体撞击,产生火花并引发火灾。消防部门在扑灭火情时切断了主电源和备用发电机的电力供应,导致该可用区全面断电。

AWS 随后确认,这是一起由外部物体撞击导致的火灾事故,但官方并未进一步解释这些物体具体是什么。

在 mec1-az2 事故发生之后,mec1-az3 也出了问题。

目前 AWS 中东(ME-CENTRAL-1)区域有两个可用区(mec1-az2 和 mec1-az3)出现了故障。S3 作为区域级服务,本身设计上可以承受单个可用区完全掉线的情况,同时依然保持数据耐久性和可用性。 在 3 月 1 日凌晨约 04:00 PST,mec1-az2 发生断电时,S3 起初仍然能够正常工作。但随后第二个可用区也变得不健康后,S3 的错误率开始上升。当两个可用区都严重受影响时,客户在进行 S3 数据写入(ingest)和读取(egress)时遇到了大量失败。
我们强烈建议客户调整应用逻辑,将 S3 数据写入操作切换到其他 AWS 区域来减轻影响。在实际条件允许的情况下,我们将尽快开始恢复这两个受影响的可用区,这包括对数据状态进行仔细检查以及必要的存储修复。  此外,我们确认由于两个可用区同时故障,AWS 管理控制台和命令行界面(CLI)也出现了中断。 我们正在推动所有服务恢复工作,并计划在 3 月 2 日 06:00 AM(PST)之前发布进一步更新,如果有新的进展也会提前通知。

虽然官方没有直接把 mec1-az3 的故障归结为物体撞击,但给出的描述是“另一个可用区也受到了电力与网络连接问题的影响”,并未能及时恢复供电和服务状态。

我们确认中东区域另一个可用区 mec1-az3 也受到了局部电力问题的影响。与此同时,在剩余可用区 mec1-az1 上,客户也开始遇到 EC2 API 错误率上升和实例启动失败的情况。由于整个区域的电力和服务异常,目前该区域内无法启动新的 EC2 实例,不过已存在于 mec1-az1 的实例应该不受影响。 

在 mec1-az2 电力中断后,该区域的基础设施供应链与网络互联受损,使得本来相对独立的 mec1-az3 也出现了电力波动或网络隔离等问题。

由于两个 AZ 的服务都受到了严重影响,客户在执行跨 AZ 的写入/读取、API 调用时出现了高错误率和大规模失败

据 AWS 状态更新,ME-CENTRAL-1 内的多个核心服务(包括 EC2、S3、DynamoDB 等)出现显著错误率上升和延迟,建议客户将工作负载转移到其他 AWS 区域。

AWS 公告:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

云头条声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片