AWS的宕机事件提醒我们,当如此多的资源依赖于单一服务提供商时,现代数字系统变得多么脆弱。域名系统 (DNS) 记录的故障引发了亚马逊网络服务 (AWS) 基础设施的连锁反应,导致超过 14,000 个网站瘫痪,短短两小时内就造成了超过10 亿美元的损失,其中包括Coinbase、MetaMask 和 Robinhood 等知名网站。即使服务恢复后,数据同步问题又引发了进一步的连锁反应,造成了更大的中断。
概括
AWS 服务中断暴露了过度依赖少数超大规模云提供商会造成系统脆弱性,单个 DNS 故障可能会波及数千个服务和关键基础设施。
集中化虽然提高了效率,但也集中了故障点,使政府、金融系统和数字身份框架面临风险,而自动化和规模化只会加剧这些风险。
真正的韧性需要分布式架构——可验证的凭证、信任注册表和去中心化验证——以减少单点故障,并允许系统安全地发生故障,而不是发生灾难性的故障。
AWS试图通过多个本地故障点来保障安全,但却未能预料到区域性DNS中断的情况。作为超过90%财富100强企业的云服务提供商,此次事件表明,即使是最大的集中式云服务提供商也无法完全防范集中化带来的风险。这也暴露了过度依赖缺乏适当安全保障的关键基础设施会带来的后果。
当私营企业争相恢复访问时,各国政府却在同样的错误假设下,往往使用相同的服务提供商,构建人工智能和国家数字身份等关键公共基础设施。一旦这些基础设施出现故障,身份验证、支付和基本服务的访问都可能同时中断。此次事件暴露了一个简单的真相:当关键基础设施集中在一处时,其韧性就会消失,即使是最大的云服务提供商也无法完全防范集中化带来的风险。
问题不应该是是否会再次发生重大故障,而是何时发生,以及如何应对这种集中化的风险。分布式和去中心化基础设施、可验证凭证和信任注册表等技术已在全球范围内部署,以确保将集中式故障的概率降至最低。允许数据保留在部门孤岛中,同时将身份验证与集中式数据库解耦,从而默认实现身份隐私。
01
集中化是一种结构性风险,而非技术性错误
AWS 的宕机暴露了现代互联网底层架构的深层缺陷。如今,互联网的大部分骨干网络都依赖于少数几家云服务商、CDN 和 DNS 提供商。AWS、微软 Azure 和谷歌云这三大超大规模云服务商,目前控制着全球近70%的云基础设施市场。正如最近所见,一旦其中一家出现故障,其影响将远远超出其自身的网络范围。简而言之,我们的系统设计之初是为了实现不间断运行,就像精益生产工厂一样——为了保证产量而优化,但一旦生产线停止运转,系统就会变得脆弱不堪。
这个问题遍及各行各业;公共机构也使用相同的云服务提供商来运行日益庞大的国家数字身份框架、支付系统和人工智能模型。最初追求无缝扩展的初衷,如今却演变成一种依赖关系,将关键系统以日益紧密的方式捆绑在一起。
当日常生活如此依赖于少数几个平台时,故障就不能再被视为孤立事件。它们会变成系统性风险,波及所有与之相关的事物。
02
规模带来的虚假舒适感
集中式系统在便捷易用时效果最佳。它承诺速度快、效率高、成本低——谁会拒绝这些优势呢?然而,集中式系统也隐藏着诸多弊端。当所有数据都流向同一主干网时,系统的韧性终将转化为脆弱性。
即使像AWS那样内置了冗余机制,集中式系统也存在同样的弱点。一个错误的设置、一次安全漏洞或其他问题,例如常见的DNS故障,都可能导致整个扇区瞬间瘫痪。
自动化一旦普及,风险就会上升。一旦这些系统崩溃,轻则导致用户无法访问互联网和账户,重则可能导致支付、公共服务甚至国家身份信息丢失。
讽刺的是,这些旨在通过自动化提高效率来消除停机时间的系统,也造成了一种连片刻故障都无法容忍的环境。每一层自动化都增加了便利性,但也减少了人为监督,一旦出现问题,风险就会加剧。除非人们像重视效率一样重视系统韧性,否则每一次故障都会提醒我们,我们对系统的控制力是多么有限。
03
分布式系统是韧性的基础
真正的韧性并非来自增加备份服务器的数量,而是来自消除对单一控制点的需求。去中心化系统正是通过设计实现了这一点。
在去中心化网络或系统中,独立的节点可以独立地进行决策和验证。要在实际系统中实现这一点,需要一些机制,允许在不持有底层数据的情况下验证信息。可验证凭证、基于区块链的信任注册表和自主身份等技术已经实现了这些原则。验证无需将数据存储在单一系统中并进行检查,而是可以通过分布式网络以加密方式执行。
这意味着数据可以保留在它原本所在的部门或组织系统中,而验证则可以与数据的集中化解耦。验证无需提取或暴露集中存储在某个位置的底层数据,从而消除了最大的单点故障,同时将数据保留在它应该在的地方——拥有它的个人或实体手中。我们无需重构整个基础设施,而是需要降低故障的规模和影响。
应用于人工智能领域,这意味着模型可以从多个可信来源获取经过验证的数据,而无需依赖单一的中央枢纽。金融领域的合规性检查可以在分布式系统中运行,这些系统可以验证交易,而无需经过每个服务提供商。总而言之,这将构建一个即使发生故障也能安全运行,而不是灾难性故障的基础设施。
04
关键基础设施不必如此集中
关键基础设施不必依附于庞大的集中式数据库,后者虽然扩展了企业和政府掌握的信息,却也为欺诈者和关键系统故障提供了诱人的陷阱。我们无需单一的数字骨干网就能使关键系统高效协同工作。通过分布式系统、开放标准和可验证数据,即可实现互操作性,这些方法能够在不集中控制权的情况下协调数据。
我们已经具备了这种能力——区块链和 Web3 技术使金融、身份和人工智能等行业能够在独立的网络中安全地进行协调,而不是依赖于一个中央提供商。
这种设计的基础设施能够自动建立边界,限制数据的共享范围、存储方式和访问权限,同时还能促进原本不打算协同运行的系统之间的协作。效率源于分布式,而非依赖。
真正的成本不仅在于关键的集中式服务再次宕机,更在于下一代用于人工智能、国家身份识别和云服务器的数字基础设施能否构建得足以抵御故障。通过采用分布式验证和基于区块链的信任框架,我们可以构建增强韧性而非掩盖其当前脆弱性的系统。
免责声明:
本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系删除。所有信息不构成任何投资建议,加密市场具有高度风险,投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。
设为星标 避免错过
虚拟世界没有旁观者,每个点赞都是创造历史的像素
关注我,一起探索AWM⁺
2025-11-24
2025-11-21
2025-11-20
商业赞助
点击下方 “目录” 阅读更多
热门跟贴