北京时间2024年7月19日下午,微软公司遭遇了前所未有的技术故障,全球范围内的用户纷纷在社交媒体上分享系统蓝屏的惊魂一幕,Azure云服务与Microsoft 365应用套件遭遇访问障碍,功能受限乃至全面瘫痪。

Falcon sensor for Windows version 7.11在线时间在北京时间7月19日中午12点09分到13点27分之间,下载了问题更新的系统会遭遇崩溃。

此次事件在全球迅速蔓延,波及航空公司、银行、交易所、教育机构及个人用户,IT基础设施的脆弱性暴露无遗。随后,据微软官方通报,故障的原因是由于美国网络安全公司CrowdStrike的一次软件更新错误,导致安装了其安全软件“Falcon”的Windows系统出现蓝屏崩溃。

随着问题迅速蔓延,美国、欧洲及澳大利亚、日本、印度等全球多地的航班系统、银行系统、政府网络、超市自动收银机等多个领域均受到影响。国内方面,由于CrowdStrike软件装机量较小,航班、高铁、银行服务等公共基础服务设施依旧如常,并未受到影响。

故障发生后,CrowdStrike在全球范围内撤销该更新。数小时内,网络安全公司CrowdStrike美股盘前大跌超18%,收跌11.1%,市值蒸发近百亿美元。

CrowdStrike如何导致蓝屏?问题如何解决?

Falcon平台是CrowdStrike的核心产品,它一个完全基于云端部署的SaaS模型,能够提供实时的攻击指标、威胁情报和不断进化的对手手法技术。平台通过一个轻量级的代理架构实现快速且可扩展的部署,并提供高级别的保护和性能。

据悉,此次故障来源于一次针对Windows主机的单一内容更新中的缺陷,Mac和Linux系统不受影响。更新中包含的错误配置文件触发了操作系统级别的不稳定,具体表现为特定的系统驱动文件(如"C-00000291*.sys")与Windows内核的兼容性问题,进而导致蓝屏错误。

CrowdStrike的联合创始人兼首席执行官George Kurtz承认了这一问题,并表示已经部署了修复措施:

“CrowdStrike正在积极与受影响的客户合作,解决在Windows主机上发现的单一内容更新中的缺陷。Mac和Linux主机不受此影响。这不是一起安全事件或网络攻击。”

除Mac和Linux设备外,所有Windows台式机与笔记本电脑若遭遇此次更新导致的停机问题,均被要求执行进一步的更新操作。对于在Azure上运行Windows客户端/服务器虚拟机的用户,微软建议可能需要多次重启(最多15次)才能解决重启循环的问题。

由于没有自动化的措施可以执行批量集中修复,而手动修复需要删除受损文件等比较耗时,对于管理着数百万台计算机的大型企业用户而言,可能需要几天或更长时间完成修复工作。

关键启示与思考

此次由CrowdStrike软件更新错误引发的微软技术故障,揭示了在全球供应链高度依赖的当下,单一环节的失误如何迅速波及全球。这一事件促使我们重新审视技术生态的多元化与安全性,强调了构建自主可控IT生态系统的重要性。

在全球网络空间成为国家战略竞争新高地的背景下,英方软件作为国内专注于数据复制与保护技术的领军企业,凭借其自主研发的先进数据复制与保护技术,开发了高可用、易管理、低成本的数据保护产品及解决方案。

国产化兼容性适配方面,英方软件已完成与上百家国产操作系统、芯片、数据库及云平台的深度适配工作,确保在复杂的国产化IT环境中,用户能够快速切换与高效运行。这种广泛的兼容性确保了英方产品能够在国产化环境中稳定运行,为大型央国企、政府、能源、运营商、民航、铁路等国家关键领域提供了强有力的数据安全和业务连续性保障。

长远来看,构建自主可控的IT生态系统不仅是实现国家信息安全和可持续发展的必由之路,也是推动国内企业技术创新与产业升级的关键举措。聚焦于产业层面的动态,由北京信息灾备技术产业联盟匠心策划并设立的“7.19中国灾备日”,正是这一战略愿景下的一项重要举措。

持续守护数据安全与价值,英方软件将继续加大研发投入,优化产品性能,提升用户体验,为构建安全、可靠、高效的数字中国奠定坚实基础。