影响有多大呢?相当于5个阿里云宕机10个小时,相当于阿里云过去十年故障总和那么严重!
飞机无法停靠:Delta的红眼航班飞机降落已经30分钟了,但一直没动静,机长广播说:因为aws的网络服务中断,飞机现在没法停靠,只能在跑道上等待。
电商上不了货,真狗:
这种程度的全球性、长时间宕机是云计算行业的“核弹级”灾难,全球数百万依赖 AWS 的企业(包括 Netflix、Amazon.com、许多金融科技公司等)的业务中断,这是全球新闻头条,事后要引发巨大的金融和法律后果!
快凌晨4点了,我终于可以休息了,离亚马逊下午三点开始的故障,已经过去11个小时。
下午六点,亚马逊宣布服务恢复,可事实上仍然是各种服务继续故障:EC2无法拉起,Redis访问巨慢,Aurora数据库连不上,host异常。。。
通过限流降级,从US-EAST-2调机器,拉着亚马逊的人一直提工单提高事故等级,我们的业务总算保住,故障控制在P1范围内。
我的朋友,出海公司老板带着兄弟们熬了一夜,服务只恢复了40%,现在去睡会儿过一小时再起来接着整。
崩了10个小时,亚马逊股价反而上涨了1.5% 真的是可笑讽刺之极!
AWS主机房崩溃,就算你的服务部署在欧洲,还是会受影响,多AZ毫无用处,除非做了多云部署,否则难逃此劫。
亚马逊无数个服务,宣称自己可用性在99.99%:
经过今晚此役,直接降到两个9,什么概念?连知乎都不如!
以下公司,除了亚马逊自己,可以一起要索赔了:
后记
信任一旦失去,重建就极其困难,期待其他云计算平台奋起直追,夺走更多aws份额,让云服务更安全可靠。码农朋友们,出海朋友们,一定要敬畏线上环境,做好限流降级预案,做好多云容灾。
因为,世界是个巨大的草台班子。
不刷短视频,读我的公众号长文还读完了?您真是一股清流!如果觉得写得不错,欢迎点赞、在看、关注。如果有不同看法,欢迎在评论区或者后台留言讨论。
我是刀哥,大厂工作过几年,现在是出海创业者,深入研究AI工具和AI编程。关注我,了解更多AI知识!我们下期再见!
热门跟贴