今天(11月18日),由于Cloudflare出现问题,互联网的许多部分出现了重大问题。

这家互联网基础设施服务提供商花了几个小时调查并修复了一个影响多个知名品牌的广泛问题,包括Twitter/X和ChatGPT/OpenAI。

目前问题似乎已经解决——但这几个小时发生了什么呢……

首先,这个问题似乎影响了多个主要网站,包括X,前身为Twitter,电影评论网站Letterboxd——甚至还有故障跟踪网站DownDetector,这让我们追踪问题变得相当棘手……

Cloudflare已确认此问题,并在格林威治标准时间上午11:48发布了声明;

“Cloudflare已意识到并正在调查影响多个客户的问题:广泛的500错误,以及Cloudflare仪表板和API也出现故障。”

“我们正在努力了解问题的全面影响并减轻其影响。更多更新将很快跟进。”

如果你对这家公司不熟悉,Cloudflare提供广泛的在线基础设施,支持一些全球最大的的网站。

该公司的服务包括针对网络攻击的保护,特别是DDoS攻击,受害者会遭到大量请求的轰炸。

有趣的是,Cloudflare早些时候发布了计划在其某些服务器上进行“定期维护”——这可能是导致问题的原因吗?

“我们将在2025年11月18日12:00至15:00 UTC期间,在SCL(圣地亚哥)数据中心进行定期维护,”该公司在其状态页面上说。

“流量可能会从该位置重新路由,因此在维护期间,受影响地区的用户可能会感受到轻微的延迟增加。对于在此位置与我们连接的PNI / CNI客户,请确保您预期在此维护窗口期间此流量会转移到其他地方,因为该数据中心的网络接口可能会暂时不可用。”

我们已经看到一些故障报告有所减少——这是否意味着问题在真正开始之前就结束了?

Cloudflare尚未发布任何官方确认或更新,但我们会继续保持关注……

有趣的是,似乎在英国(我现在就在这里打字),情况正在好转——但在美国,DownDetector显示故障报告又出现了小幅上升……

在一个讽刺的时刻,Cloudflare 的状态页面居然也无法访问...

“我们现在无法连接到这个应用或网站的服务器,可能是因为流量太大或者配置出错。”

啊,它回来了……不过还是没有什么新消息。

“好消息是,Cloudflare 说情况可能在好转...”

“我们看到服务在恢复,但客户可能还是会遇到比正常情况更高的错误率,因为我们还在修复中,”其最新更新在状态页面上说。

看起来这个问题也影响了 Cloudflare 的内部,特别是在客户支持上。

“我们的支持门户提供商现在遇到问题,所以客户在查看或回复支持案例时可能会出错,”公司表示。“客户咨询的回复不受影响,大家仍可以通过 Cloudflare 控制面板的在线聊天(商业和企业)或紧急电话(企业)联系我们。”

“我们正在与我们的第三方提供商合作,以了解全面影响并减轻此问题。”

好消息是,Twitter/X 看起来已经恢复正常运营。

这是最早受到 Cloudflare 问题影响的网站之一 - 您可以在这里关注 TechRadar 的实时报道。

停机报告在减少,但 Cloudflare 还没正式宣布结束,实际上最新的更新说的正好相反。

“我们正在继续调查此问题,”它在 12.37 UTC 发布。

如果你觉得这不是个大问题,那你就错了,这确实在影响着人们的生活。

我刚刚尝试在我们Future公司的内部人力资源系统上预订下个月的假期,但由于Cloudflare的故障,网站无法正常工作。

看来我这次是没法享受圣诞假期了……

不过这情况一定很棘手——这是连续第四次更新,Cloudflare的信息还是一样的;

“我们正在继续调查这个问题。”

我想他们能及时给我们更新消息还是好事吧?

我们在DownDetector上看到故障报告又出现了激增——但这是可以预期的,因为美国东海岸的大多数人现在都在醒来并登录工作。

这种额外的服务器和服务压力会不会加剧问题呢?只有时间才能告诉我们……

如果你在伦敦(和我一样),那就有坏消息了——Cloudflare正在对这里的用户采取强硬措施,以试图解决问题。

“在我们尝试修复的过程中,我们已经在伦敦禁用了WARP访问。试图通过WARP访问互联网的伦敦用户将会看到连接失败。”

但好消息是!问题已经被确认,修复正在进行中……

“问题已经被识别,修复正在实施,”Cloudflare在其更新页面上说。

伦敦的朋友们也可以松一口气——“我们已经做出了一些改变,使Cloudflare Access和WARP得以恢复。Access和WARP用户的错误水平已恢复到事件发生前的水平。”

Cloudflare还没有正式确认问题已经解决,但故障报告仍在急剧下降,希望这能是个好兆头吧?

有个有趣的补充——现在看起来ChatGPT也可能受到Cloudflare故障的影响。

聊天机器人的网站目前显示错误信息,告诉用户:“请解除对 challenges.cloudflare.com 的屏蔽以继续”,我们在其他地方也见过这个信息——所以事情可能还没有平息。

与此同时,Cloudflare 表示他们仍在全力修复问题,并发布了消息:“我们正在继续努力恢复应用服务客户的服务。”

我们还收到了 Cloudflare 的官方声明,配合公司状态页面上发布的更新。

“我们在协调世界时间 11:20 开始看到 Cloudflare 的一项服务出现异常流量激增。这导致通过 Cloudflare 网络传输的一些流量出现错误。我们尚不清楚异常流量激增的原因。我们全力以赴,确保所有流量都能无错误地处理。之后,我们将转向调查异常流量激增的原因。我们将在 cloudflarestatus.com 上发布更新,并在准备好时提供更深入的分析 blog.cloudflare.com。”

我认为可以公平地说,美国现在在线了……这可真是个大激增!

如前所述,此次故障受影响最大的公司似乎是 Twitter 和 ChatGPT,两者都报告了问题,很可能是由于 Cloudflare 的问题。

我们将分别报道这两次故障——您可以在 这里查看 Twitter/X 故障的更新,以及 这里查看 ChatGPT/OpenAI 的问题。

来自 TechRadar Pro 的网络托管专家 James Capell 的一些看法……

“Cloudflare 为网站提供了许多后台服务,这些服务对确保网站安全、平稳运行至关重要。

Cloudflare 最受欢迎的服务是其 CDN 网络,这是市场上最大的网络,几乎所有人都在使用,包括 最佳网络托管提供商,正因如此。Cloudflare 还提供安全功能,如 CAPTCHA 和其他验证方法。

显然,Cloudflare 发生了一些事情,我们不确定是什么,但这导致依赖 Cloudflare 的网站变得无法访问。

最近的全球互联网故障突显了网络在多大程度上依赖于少数几家公司。”

不过,回到我们的常规更新,来自 Cloudflare 的最新消息……另一个可能的修复方案正在路上。

“我们已部署了一项更改,恢复了仪表板服务,”它表示。“我们仍在努力修复广泛的应用服务影响。”

就这样,我们可能找到了解决方案!

Cloudflare的最新更新表示:‘修复已经实施,我们相信事件现在已经解决。’

“我们将继续监控错误,以确保所有服务恢复正常。”

现在我们等待……修复需要一些时间才能推广,但我们已经看到DownDetector的故障报告略有下降,希望这可能是结束的开始。

DownDetector上的故障报告仍在持续下降,但我们会再监控一段时间以防万一……尤其是美国西海岸即将醒来并登录,这可能会再次引发问题!

如果您仍然遇到某些服务的问题,请不要担心,Cloudflare正在处理。

“一些客户可能仍在遇到登录或使用Cloudflare仪表板的问题,”该公司发布了消息。

“我们正在努力修复此问题,并继续监控任何进一步的问题。”

Cloudflare现在已将该问题降级到其状态页面,排在计划的定期维护之后,因此希望这确实意味着一切现在都在掌控之中。

真是过山车一样的一天!

最后 - Cloudflare的延长评论……

“今天,Cloudflare的许多服务在UTC时间11:20左右发生了重大故障。该故障在UTC时间14:30完全解决。故障的根本原因是一个自动生成的配置文件,它用于管理威胁流量。该文件的条目超出了预期的大小,导致处理Cloudflare多个服务流量的软件系统崩溃。”

“明确来说,没有证据表明这是攻击的结果或由恶意活动引起的。我们预计在事件后流量自然激增时,某些Cloudflare服务会短暂降级,但我们预计所有服务将在接下来的几个小时内恢复正常。详细说明将很快发布在blog.cloudflare.com上。鉴于Cloudflare服务的重要性,任何故障都是不可接受的。我们对今天让客户和互联网感到失望表示歉意。我们会从今天的事件中吸取教训,努力改进。”