云服务一哥也翻车?一个 DNS 错误何以瘫痪全球服务?
“多邻国打卡断了”“Robinhood 登不上卖不了股票”“连麦当劳 APP 都点不了餐”——10 月 20 日下午,一连串吐槽突然霸占社交平台热搜。
几乎全球大半的服务都断了!
没人能想到,这场波及大半个美国互联网的瘫痪,源头只是亚马逊 AWS 美国东部 1 区(弗吉尼亚北部)的一个 DNS 解析问题。
这场故障始于美国东部时间凌晨,最先拉响警报的是监测网站 Downdetector,AWS 相关故障报告瞬间飙到 5 万份,创下年内峰值。从 AWS 官方接连发布的通报能清晰看到故障演进:凌晨 1 点 26 分确认 DynamoDB 请求错误率飙升,1 小时后锁定根因是该服务端点的 DNS 解析异常,直到凌晨 4 点左右才宣布底层 DNS 问题缓解。
DNS 这东西说起来不复杂,相当于互联网的 “地址簿”,负责把网站域名转换成服务器能看懂的 IP 地址。可就是这个基础功能出问题,直接引发连锁反应。
作为 AWS 的核心数据库服务,DynamoDB 一罢工,依赖它存储数据的服务全受牵连:亚马逊电商没法下单,Alexa 语音助手变 “哑巴”,迪士尼 + 的剧集卡在加载页,甚至英国税务系统和劳埃德银行的网上服务也跟着瘫痪。
更要命的是,连用户提交故障工单的 Support Case 系统都崩了,不少企业运维人员只能在论坛抱团等消息。
这不是 AWS 第一次掉链子。翻下历史记录,仅 2010 到 2019 年就有 22 次突发故障,平均每年 2.4 次。2017 年更夸张,一名程序员输错脚本删除服务器,导致 S3 存储服务宕机 4 小时;
2021 年 12 月的故障直接让亚马逊损失超 1800 万美元,连 Facebook、Netflix 都跟着遭殃。有意思的是,这次出问题的 US-EAST-1 区域,几乎是故障常客 ——2011 年雷击断网、2012 年雷暴引发 29 小时宕机,都是在这个核心数据中心。
为什么全球最大的云服务商总在同一个地方栽跟头?从技术角度看,US-EAST-1 是 AWS 最早建成的区域,聚集了太多核心服务和客户,相当于把所有鸡蛋放一个篮子里。
虽然 AWS 号称有多可用区架构,但这次 DNS 解析这个 “总开关” 出问题,下游服务再强也没用。对企业来说,这更是惨痛教训:Coinbase 用户因无法交易错失行情,多邻国用户担心几百天的连胜纪录泡汤,还有游戏玩家眼睁睁看着《堡垒之夜》团战掉线。
网友的吐槽和调侃早已刷屏。有人精准总结:“今天的互联网生存现状:多邻国断了,Roblox 登不上,Venmo 转不了账,只能去麦当劳排队,结果 APP 也崩了”。
技术圈网友更直接:“DNS 这玩意儿,平时没人当回事,一崩就是核爆级别的影响”。
还有人翻出旧账:“2015 年 DynamoDB 超时崩过一次,2025 年又是它,这是祖传 BUG 吗?” 甚至有运维自嘲:“今天啥也没干,光刷 AWS 状态页了,KPI 全靠祈祷”。
截至当晚,大部分服务已恢复,但 EC2 实例启动仍有错误。这场故障再次证明,没有绝对可靠的云服务。对普通用户来说,或许只是一天的不便;但对企业而言,是时候考虑多云部署 —— 别把所有业务都绑在一家服务商身上,毕竟 DNS 崩了可以换地址,但生意停了可补不回来。
高赞文章推荐
荷兰封禁安世中国团队账号,不排除紧急情况下切断系统资金!闻泰回应:不得不采取自救!网友:这是被抢了300多亿啊!
杨振宁直言自己一生中最重要的贡献:是帮中国人克服了自己不如人的心理!网友:伟大的科学巨匠
黄仁勋自曝英伟达在中国市场跌到0%,难以想象美国政策制定者会认为失去全球最大的市场之一是一个明智选择!
小米SU7成都事故后,雷军首次现身演讲!尽显低调,弹幕很多“雷总好久不见,想你了雷总,雷总加油”
印尼国防部长确认:将采购中国歼-10战斗机!网友:金杯银杯不如巴印空战实战口碑
英国物理学会主席:中国极有可能成为全球首个核聚变发电的国家!美国已经放弃应对气候变化
解说激动不已:星舰从4000公里时速刹到瞬间悬停!网友:big胆,致敬雷军
查理·芒格:除了跟中国开展相对自由的贸易,我们别无选择,强国更替、中国崛起是自然规律,何必恼火?
美经济学家萨克斯:美国正试图损害中国经济,通过关税、技术禁令、全面信息战围堵中国这些招数,注定失败!
美媒称台积电因芯片含中国稀土,无法向美国出售任何半导体芯片!网友:正当之举,岂容歪曲
印度出息了!莫迪宣布将派空军教员赴英国担任英皇家空军教练!网友:日不落帝国没落成这样了?
特斯拉FSD落地缓慢,马斯克说是因为中国车企阻挠!网友:全球都验证了不行,泼脏水给中国第一名
热门跟贴