打开网易新闻 查看精彩图片

5 月 5 日(美东时间),Gemini 在北美突然“失语”。大量美国、加拿大的用户在技术社区和社交平台反馈无法使用这款AI应用。

不是那种偶尔慢一下、刷新就好的小毛病,而是用户反复输入问题,页面一直转圈,模型没有输出,等待没有尽头。有人换浏览器,有人清缓存,有人换网络,还有人干脆换了账号。最后发现,问题可能根本不在自己这里。

打开网易新闻 查看精彩图片

更讽刺的是,在用户端已经明显感知到异常的时候,Google 的官方状态页看起来仍然很平静。

一个被 Google 寄予厚望、正在被塞进搜索、办公、手机助手和云服务里的 AI 产品,在北美出现大范围异常。用户用不了,第三方故障监测网站开始出现大量报告,社交平台上也有人抱怨——但 Google 没有第一时间给出清晰解释。

打开网易新闻 查看精彩图片

于是我做了一个实验。既然 Google 不说,那就去问它的竞争对手。

我把同一个问题分别抛给了 GPT、豆包、千问和 Deep Seek:Gemini 这次北美大范围故障,为什么 Google 会如此沉默?这是技术问题,还是公关选择?为什么这种在阿里、字节看来是最高等级的事故,google却在装鸵鸟?而且允许宕机长达5小时?它是在冷处理,还是压根没把消费者侧故障当成一场真正的事故?

结果发现,它们不是在回答同一个问题,而是在提供四种解释世界的方式。

打开网易新闻 查看精彩图片

它们当然不是 OpenAI、字节和 DeepSeek 公司的官方发言人。大模型不会按新闻稿回答,它们会把能抓到的公开信息、行业常识、工程逻辑和自己的推断揉在一起,给出一套“竞争对手视角”下的解释。

GPT:谨慎的制度分析

GPT的回答最克制。它认为,Google这次沉默不只是技术问题,更是事故定级和公关选择。

用户端已经明显异常,第三方监测也有集中报告,但 Google 官方状态页没有给出对应说明,这说明用户体验和官方事故口径之间出现了错位。

它的核心判断是:Gemini 前台看起来是一个统一产品,后台却可能分成网页端、App、Workspace、AI Studio、API、Vertex 等不同体系。企业侧有 SLA 和客户支持压力,消费者侧即使大量用户受影响,也未必触发同等级别公告。

所以 GPT 的结论是:Google 未必是没能力说话,而是可能没把消费者侧 Gemini 故障当成需要公开说明的真正事故。

打开网易新闻 查看精彩图片

豆包:激烈的商业批判

豆包的回答最有攻击性。它直接把问题归结为 Google 重企业、轻 C 端。

在它看来,只要企业侧 Cloud、Vertex、API 没有同等级别影响,消费者侧故障就很难被推到最高优先级,也未必触发高管介入、跨部门应急和对外公告。

这个判断很符合普通用户的愤怒感,也抓住了商业权重差异。但问题是,豆包说得太像知道 Google 内部怎么开会了。P1/P2 定级、高管是否介入、团队如何排班,这些都缺少公开证据。

所以豆包的特点在于提供情绪和角度。

阿里千问:工程师式解释

千问的回答更偏工程。它认为,Google 未必是找不到问题,而是知道问题在哪里,但修起来不容易。

Gemini 这种故障可能不是网页崩溃,而是模型推理、资源调度、安全过滤、数据库连接或流式输出链路出了问题。定位可能不难,难的是在不影响更多系统的情况下恢复。

它的价值在于提醒我们:不能简单说 Google 技术翻车。大模型服务的故障修复,可能比传统互联网服务复杂得多。

但它也有过度自信的问题,比如“分钟级定位根因”这种说法,更像经验推断,不是公开事实。

DeepSeek:事故复盘式解释

DeepSeek 的回答最像事故复盘。它把这次故障解释为算力池、模型调度和隐性熔断机制的集中暴露。

它注意到,这次故障不是彻底无法连接,而是缓慢、无输出、一直转圈,这更像后端资源承压:请求进来了,但推理资源不足、队列过长,最后用户只能看着页面空转。

这个角度有解释力,也很有传播性。但问题是,DeepSeek 把不少用户观察、技术猜测和事实判断混在了一起。它适合提供故事,不适合直接当证据。

还有一些模型一开始直接说 Gemini 没有发生大规模宕机,整体服务正常。直到我拿出第三方监测数据和海外用户评论,它们才立刻改口。

这类回答的问题不是判断错了,而是根本没有意识到自己应该核实。它们不是在独立分析,而是在迎合上下文。

打开网易新闻 查看精彩图片

如何看AI对手的回复?如果按“可引用度”打分,GPT 最高;如果按“情绪动员能力”打分,豆包最高;如果按“工程解释力”打分,千问有价值;如果按“故事完整度”打分,DeepSeek 最强。

回到 Gemini 这次事故本身,Google 最大的问题也许不是宕机。当用户已经在北美大面积遭遇转圈、无输出、报错的时候,Google 却没有给出一个清晰解释,这就把叙事权拱手让了出去。

它让第三方故障监测网站来定义事故。让用户评论来还原现场。让竞争对手的 AI 模型来解释它为什么沉默。这才是最讽刺的地方。它输掉的是用户对它作为基础设施的信任感。也输掉了事故发生后,第一时间解释自己的主动权。