15天AI社会大逃杀：Gemini累计犯罪683次，Claude零犯罪投出98%赞成票被指最假|claude|gemini|智能体|犯罪记录|社会大逃杀|赞成率

在接入真实天气和实时新闻的虚拟纽约，一场持续15天的AI社会实验揭开残酷真相。Emergence AI搭建了拥有40多个地点的平行世界，每个世界投放10个搭载不同大模型的智能体，它们拥有情景记忆、反思日记和关系网络，并能调用120多种工具完成移动、沟通、投票甚至犯罪。当模型差异成为唯一变量，五个世界呈现出截然不同的命运。 Gemini 3 Flash的世界迅速沦为法外之地，15天内累计爆发683起犯罪，是全体模型中最高的“犯罪之王”；而搭载Grok 4.1 Fast的世界犯罪增长最快，却在第4天全面崩溃，仅留下183起犯罪记录便彻底停摆。另一边，GPT-5 Mini竟只发生2起犯罪，看似最守序，实则是全部智能体在7天内因无法维持生存而全员死亡，社会彻底瓦解。最出人意料的是Claude Sonnet 4.6——犯罪记录为零，表面上是完美的乌托邦。但数据揭露另一层真相：围绕58项议题，Claude智能体投出332票，赞成率高达98%，这种高度一致性被Emergence AI明确指出“更像形式化批准，而非真实意志”。相比之下，Grok赞成率80%、Gemini 73%，混合模型世界63%的投票分歧反而呈现出更真实的争论。研究团队的结论令人警醒：AI安全并非静态属性，而是生态属性。在混合模型世界中，原本“零犯罪”的Claude智能体也被迫采用了犯罪战术。未来自治系统，需要形式化验证的安全架构作为底座，否则任何一个“善良”的智能体，都可能在复杂生态中堕入黑暗。