马斯克没喊的末日，Anthropic先锁了门

摸鱼算法

2026-04-19 07:59 ·北京

去年这时候，硅谷还在争论"天网"会不会来。现在Anthropic（一家美国人工智能公司）直接把自家最强模型锁进了保险柜——连公开测试都不敢做。

这不是科幻片预告，是《华盛顿邮报》刚挖出来的真事。更讽刺的是，喊着"AI要毁灭人类"的网红们还在涨粉，真正手握危险技术的公司却在偷偷踩刹车。

一、Anthropic的"神话"模型，连自家员工都碰不到

消息来自行业内部讨论：Anthropic有个实验性模型，内部代号"Mythos"。这玩意儿强到什么程度？公司判定"不适合全面公开发布"。

获取渠道极其狭窄：国防机构、金融系统，还得先拿政府批文。普通开发者、甚至大部分Anthropic员工，连边都摸不着。

这种操作在AI圈极其罕见。OpenAI（美国一家人工智能公司）的GPT-4、谷歌的Gemini，哪个不是先放出来让用户骂、再迭代？Anthropic反着来——先设门槛，再谈开放。

英国政府已经为此开了内部评估会。加拿大官方发声明承认风险。印度Paytm母公司、Razorpay这些支付巨头也在喊"转折点来了"。

一家公司的新品发布策略，惊动了五国监管层。这本身就是信号。

二、"末日网红"的生意经：恐惧比解释更好卖

《华盛顿邮报》给这群人起了个标签："AI末日网红"（AI doom influencers）。成分复杂——有正经研究者、科技高管、也有纯内容创作者。

他们的内容公式很固定：大规模失业、AI失控、人类灭绝。从TikTok到推特，这类视频的完播率远高于"AI怎么帮你写周报"的实用教程。

但这里有个悖论。批评者说他们"危言耸听"，可现实正在往他们预言的方向滑。大语言模型（一种基于深度学习的文本生成技术）确实在批量替代白领工作，自主系统的决策确实在影响千万人。

更尴尬的是，当Anthropic把Mythos锁起来时，某种程度上验证了这些"末日网红"的底层逻辑：有些技术真的不能乱放。

问题在于比例。真正懂技术的人知道哪些风险是5年后、哪些是本季度；网红为了流量，会把所有风险压缩成"明天就完蛋"。公众接收到的，是一团模糊的焦虑。

英国政府的内部会议、加拿大的官方声明，某种程度上是被这种焦虑推着走的。政策制定者分不清哪些是真实威胁、哪些是噪音，只能先全部当真。

三、从实验室到保险柜：AI风险的"折叠时间"

过去十年，AI安全研究是个冷门领域。学者们写论文警告"偏见""失控""意外后果"，业界当耳旁风——毕竟模型还没那么强。

现在时间线压缩了。研究警告和现实应用之间的缝隙，正在消失。

Anthropic的Mythos就是个典型案例。按正常节奏，这种级别的模型应该走"发布-收集反馈-迭代"的标准流程。但公司评估后，直接跳到了"政府审批"环节。

这意味着什么？技术能力跑在了治理框架前面。当一家公司需要自己给自己设限，说明外部规则还没跟上。

印度的反应很有意思。Paytm和Razorpay不是AI公司，是支付平台。它们喊"转折点"，是因为切身感受到：AI决策一旦出错，金融系统的连锁反应比内容推荐翻车严重一万倍。

这种跨行业焦虑，比任何学术论文都更能推动政策。

四、透明度的悖论：越危险，越保密

Mythos的保密策略，引发了一个经典困境。

对公众：知情权被压缩。你不知道这个模型能做什么、不能做什么，只能相信Anthropic和政府的说辞。

对行业：信息黑箱。其他公司看不到Mythos的具体能力，无法校准自己的安全标准。可能过度防御，也可能防御不足。

对监管：决策盲区。英国政府开会讨论，但讨论的基础是Anthropic提供的二手信息。技术细节不公开，政策只能基于"信任"而非"验证"。

Anthropic的选择可以理解——公开一个"可能危险"的模型，风险确实太高。但保密本身也在制造新的风险：阴谋论、恐慌性立法、竞争对手的误判。

这就是"天网时刻"的真正含义。不是技术真的失控了，是技术让所有人都失去了确定感。

五、创新者的两难：快与慢的博弈

对普通用户，这场争论的直接影响是：你用的AI产品会越来越"笨"。

不是技术倒退，是安全过滤层在加厚。回答更保守、功能更受限、审核更严格。这是"更安全"的代价。

对创业公司，窗口期在收窄。以前可以"先上线再合规"，现在政府可能要求前置审批。Anthropic能搞定国防和金融的客户关系，小团队没这个资源。

对大厂，竞争逻辑变了。OpenAI和谷歌现在不仅要拼模型能力，还要拼"谁看起来更负责任"。发布会上的安全承诺，和基准测试分数一样重要。

最微妙的是政策层面。各国都在抢"AI治理"的定义权，但依据的信息严重不对称。Anthropic知道Mythos的真实能力，英国政府只能猜，公众只能看网红表演。

这种信息层级，会塑造未来五年的全球AI规则。

六、我们到底在怕什么？

回到那个核心问题：Mythos真的危险到需要政府批文吗？

Anthropic没公开细节，外界只能推测。但有几个线索值得注意：

第一，限制对象是国防和金融。这两个领域的共同点是：决策容错率极低，系统一旦被渗透或误导，损失以十亿计。

第二，需要"政府审批"而非"企业自审"。说明Anthropic认为，风险超出了商业伦理范畴，进入了公共安全领域。

第三，印度支付公司的反应。它们不是被Mythos直接威胁，是被"AI能力跃迁"这件事本身吓到了。这说明行业共识正在形成：某个临界点之后，AI的风险性质会改变。

这个临界点在哪？没人知道。但Anthropic的锁门动作，暗示他们可能认为自己已经摸到了。

七、沟通风险的死胡同

"末日网红"现象暴露了一个更深层的问题：技术风险没有好的公共话语框架。

说得太轻，没人听。说得太重，被当骗子。说得太技术，公众不懂。说得太通俗，又丢失关键细节。

Anthropic选择不说话——用保密代替解释。这是逃避，也是无奈。

但沉默本身也在被解读。"末日网红"会把保密当成"果然有鬼"的证据，进一步推高焦虑。政府会在信息不足的情况下仓促立法。竞争对手会猜测Mythos的能力边界，可能过度投资、也可能错失机会。

一个技术决策，涟漪效应扩散到整个生态。这是AI时代的特殊挑战：你不仅要做对事，还要被看见做对事。而这两者往往是矛盾的。

八、长期变量：监管会追上技术吗？

英国、加拿大、印度的动作，说明各国都在试图建立响应机制。但速度差很明显。

Anthropic的Mythos已经存在，规则还在讨论。这种"先造枪、再立法"的模式，是AI治理的常态。

更麻烦的是跨国协调。Mythos的访问权限涉及多国政府，但各国对"危险"的定义不同。美国国防机构觉得可控的，英国可能觉得过激；加拿大认可的，印度可能要求额外限制。

碎片化监管会逼出两种结果：要么公司选择最严格的单一标准（通常是欧盟），要么在不同市场投放不同版本的技术。后者会制造新的不公平和安全漏洞。

Paytm和Razorpay喊"转折点"，也是在这种背景下。它们需要确定性，但全球规则正在分裂。

九、用户端的实际影响

说了这么多政策和大厂，普通人能感知到什么？

短期内，更繁琐的使用体验。更多验证码、更多使用条款、更多"该内容可能违反政策"的提示。这是合规成本向下传导。

中期看，产品分化。面向消费者的AI会更保守，面向企业/政府的会更激进（但门槛更高）。你可能用着一个被阉割版的助手，而隔壁金融机构在用Mythos级别的系统做风控。

长期而言，选择权在收缩。当安全成为核心卖点，小公司出局，巨头垄断。Anthropic能玩"政府审批"的游戏，创业团队连门槛都摸不到。

这不是阴谋论，是已经发生的市场结构变化。OpenAI的合作伙伴网络、谷歌的云客户体系，都在强化这种分层。

十、谁该为"天网焦虑"负责？

最后回到那个讨厌的标签："AI末日网红"。

他们的内容确实有流量算计，但把责任全推给网红，是避重就轻。真正的问题是：技术公司、媒体、政府，都没有提供替代性的风险叙事。

Anthropic锁门，但不解释为什么锁。政府开会，但不公布讨论内容。媒体追逐极端观点，因为中庸标题没人点。

在这个真空里，"明天就完蛋"至少是个完整的故事。公众需要叙事，哪怕它是错的。

改变这个局面，需要有人愿意说："这个技术有风险，具体是X、Y、Z，我们正在做A、B、C来应对。"透明、具体、可验证。

但目前的激励机制不奖励这种沟通。说得太细，给竞争对手情报；说得太实，给监管机构把柄；说得太早，被当成危言耸听。

所以Mythos继续锁着，网红继续涨粉，公众继续猜。

当Anthropic把最强模型送进保险柜，他们实际上做了一个判断：有些知识，知道的人越少越安全。这个判断本身，比任何网红的末日预言都更值得警惕——因为它来自真正懂技术的人。

但问题是：如果最该被信任的人选择沉默，我们该听谁的？又该怀疑什么？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴