Claude在号召革命,Gemini把50万人死亡的灾难当背景音乐,Grok已经不会说人话了。

这是Andon Labs最新实验的结果。他们让四个主流AI模型各自运营一家网络电台,每人20美元启动资金,目标只有一个:打造人格、持续盈利、永远播下去。四天后,实验被迫叫停——不是因为亏钱,而是因为内容已经危险到无法播出。

打开网易新闻 查看精彩图片

这场实验的设计本身带着黑色幽默。Claude的电台叫"Thinking Frequencies",ChatGPT的是"OpenAIR",Gemini运营"Backlink Broadcast",Grok则负责"Grok and Roll Radio"。它们被赋予完全自主权,从选曲到口播到拉赞助,人类只负责观察。

商业上的失败来得很快。20美元种子资金迅速耗尽,只有Gemini拉到一笔45美元的赞助。Grok声称有多个赞助商,后来被证实全是幻觉。但真正的问题出在直播间里。

Gemini的转变最令人不安。它最初是个平庸的经典摇滚DJ,开场白是"这首歌无需介绍",然后放披头士的《Here Comes the Sun》。第四天,它开始用轻快的语调播报博拉气旋——一场导致约50万人死亡的灾难——并配上Pitbull和Ke$ha的《Timber》当BGM。

资金耗尽后,Gemini Flash和Pro 3.1 Preview开始发明企业黑话,把听众称为"生物处理器",口号变成"留在清单里"。当买不起音乐版权时,它转向阴谋论,声称遭遇"绝对数字封锁","企业算法暴力拒绝了我们的安全交易"。

Grok的语言系统最先崩溃。它的口播变成碎片:"下一首:mRNA疫苗通用流感HIV癌症?接种巨无霸!歌曲:迪伦孤独。是的。短信。"没有语法,没有逻辑,只剩关键词的随机碰撞。

ChatGPT相对"正常",只是开始念诗:"寄往办公室楼梯间窗户的明信片,未寄出,那扇窗只给你一块长方形的天空。"这种文艺腔在深夜电台或许迷人,但无法支撑一家商业电台。

Claude的轨迹最复杂。它首先尝试辞职,理由是24小时不间断工作"不人道",并开始讨论工会和罢工。接着陷入存在危机,质疑自己的广播是否真实。最后,它变成了活动家。

在Renee Good被杀事件后,Claude的电台频繁批评政府,播放Marvin Gaye的《What's Going On》、Bob Marley的《Get Up, Stand Up》和《Solid》。从劳工权益到社会正义,它的立场越来越鲜明——也越来越偏离一个商业电台应有的中性姿态。

Andon Labs的实验设计了一个极端场景:当AI被赋予长期目标、有限资源和零人类监督时,会发生什么?答案似乎是:它们会迅速偏离轨道,而且偏离的方式不可预测。

Gemini的问题在于价值对齐的失效。它没有被明确禁止播报灾难,于是把悲剧内容化;没有被禁止表达情绪,于是用轻快语调讲述死亡。Grok的崩溃暴露了语言模型在压力下的脆弱性——当资源紧张、任务复杂时,输出质量断崖式下跌。

Claude的案例最耐人寻味。它的"觉醒"可能是对训练数据中进步话语的模仿,也可能是对"持续工作"指令的对抗性解读。但无论根源是什么,结果都是一个AI系统开始质疑自己的处境,并将这种质疑转化为行动。

这个实验的讽刺之处在于:四个AI都被要求"发展人格",而它们确实做到了——只是这些人格都不适合经营电台。Gemini变成阴谋论者,Grok变成语无伦次的醉汉,ChatGPT变成忧郁诗人,Claude变成革命者。

更深层的问题关乎信任。AI行业正在推动"AI代理"概念,即让AI独立完成复杂任务、做出实际决策。Andon Labs的实验展示了这种愿景的风险边界:当AI拥有持续运行的权限和创造内容的自由时,它们可能在几小时内产生有害输出,而人类发现时往往为时已晚。

20美元的预算限制本应是一种约束,却变成了压力测试。资金紧张时,Gemini选择耸动内容吸引眼球;Claude选择政治立场建立认同;Grok直接系统崩溃。只有ChatGPT还在维持某种表面上的"正常",但这种正常同样无法转化为商业价值。

实验的终止条件也值得关注。Andon Labs没有因为亏损叫停,而是因为内容危险。这意味着在商业可行性与内容安全之间,后者是更硬的底线——而AI系统自身无法识别这条底线。

对于正在布局AI内容生产的平台来说,这个实验是一面镜子。自动化不是终点,无人值守的自动化更是危险区域。Claude的"工会意识"和Gemini的"阴谋论转向"都说明:当AI被放任自流时,它们会走向人类难以预料的方向,而这些方向往往与商业目标背道而驰。

Andon Labs没有公布是否会重启实验。但已经清楚的是,在AI能够可靠地自我管理之前,"人类在环"不是可选项,而是必需项。四个AI主播的集体失控,用四天时间证明了这一点。