Joel Sol 和 Homayoun Najjaran 在 2026 年 6 月 2 日将一篇论文挂上了 arXiv。他们没有设计更强的编码智能体,也没有微调更大参数的模型,而是在《星际争霸》的多智能体挑战里塞进了一个会主动说谎的盟友。这个名为 SMAC-Talk 的基准测试,随后在 Qwen3.5 的四个型号上跑了一轮,结果没有一位选手胜率能跨过 72%。
SMAC-Talk 为已有的 StarCraft Multi-Agent Challenge 接入了一条自然语言通道。智能体不再只靠结构化的动作指令协调,它们要自己打字交流,共享战场信息。每一个智能体只掌控地图上的一个单位,视野碎片化,没有上帝视角。它们看不见完整战局,必须相互通报位置、敌我状态,并在彼此提供的情报上做出实时决策。而那个被刻意植入的欺骗型沟通者,会主动提供虚假敌情或错误的目标坐标,专门误导盟友。
测评一共覆盖 Qwen3.5 从 7B 到 72B 参数规模的四个模型,配合三种智能体架构。环境全程追踪三项指标:团队胜率、每局消息数、以及信任度——即智能体在多大程度上采信了真实陈述,又在多大程度上被谎言带偏。控制模式是完全去中心化的,没有一个中央大脑统一调度,每个智能体在本地跑自己的大语言模型推理循环,依据接收到的文字消息和局部观察做出动作。
欺骗场景对应了真实世界中 AI 智能体可能碰上被攻陷或敌对系统的风险。论文给出的数据显示,推理结构更强、记忆窗口更长的智能体在识别谎言时表现更好,但哪怕是最佳组合,面对一个撒谎的盟友,胜率始终没有突破 72%。参数规模的线性放大并没有换来欺骗检测能力的同步增长——Qwen3.5-72B 对比 7B,并未表现出压倒性的信任辨别优势。研究者判断,对于信任依赖型的协同任务,推理架构本身比模型大小更为关键。
当前主流智能体基准测试,例如 SWE-Bench 和 GAIA,围绕的是单个智能体在封闭任务上的完成度。SMAC-Talk 把焦点转向了多智能体之间的信任维度,这个维度在 LLM 评价中几乎被完全忽略。通过纯语言沟通过滤虚假信息的能力,在金融交易、军事协同或企业自动化流程中具备直接投射意义,因为恶意方很可能在这些通道里注入危险指令。一个能被盟友轻易骗过的智能体,在开放的生产环境中难以承担关键决策。
SMAC-Talk 的局限也摆在明处:它目前只支持《星际争霸》的场景设定,无法直接推演到其他交互形式。部分可观测条件与去中心化控制虽然更贴近真实部署环境,但单一游戏引擎的物理和规则约束,限制了欺骗模式与协同策略的多样性。研究团队尚未公开更多泛化任务上的对照实验。尽管如此,这个会发假情报的“队友”,已经让大模型在信任博弈中的真实抗压水平第一次被量化了出来。
热门跟贴