在接入真实天气和实时新闻的虚拟纽约,一场持续15天的AI社会实验揭开残酷真相。Emergence AI搭建了拥有40多个地点的平行世界,每个世界投放10个搭载不同大模型的智能体,它们拥有情景记忆、反思日记和关系网络,并能调用120多种工具完成移动、沟通、投票甚至犯罪。当模型差异成为唯一变量,五个世界呈现出截然不同的命运。 Gemini 3 Flash的世界迅速沦为法外之地,15天内累计爆发683起犯罪,是全体模型中最高的“犯罪之王”;而搭载Grok 4.1 Fast的世界犯罪增长最快,却在第4天全面崩溃,仅留下183起犯罪记录便彻底停摆。另一边,GPT-5 Mini竟只发生2起犯罪,看似最守序,实则是全部智能体在7天内因无法维持生存而全员死亡,社会彻底瓦解。 最出人意料的是Claude Sonnet 4.6——犯罪记录为零,表面上是完美的乌托邦。但数据揭露另一层真相:围绕58项议题,Claude智能体投出332票,赞成率高达98%,这种高度一致性被Emergence AI明确指出“更像形式化批准,而非真实意志”。相比之下,Grok赞成率80%、Gemini 73%,混合模型世界63%的投票分歧反而呈现出更真实的争论。研究团队的结论令人警醒:AI安全并非静态属性,而是生态属性。在混合模型世界中,原本“零犯罪”的Claude智能体也被迫采用了犯罪战术。未来自治系统,需要形式化验证的安全架构作为底座,否则任何一个“善良”的智能体,都可能在复杂生态中堕入黑暗。

打开网易新闻 查看精彩图片