星际争霸测试出AI软肋：被盟友欺骗难超72%胜率|推理|星际争霸(游戏)|智能体|真实世界

Joel Sol 和 Homayoun Najjaran 在 2026 年 6 月 2 日将一篇论文挂上了 arXiv。他们没有设计更强的编码智能体，也没有微调更大参数的模型，而是在《星际争霸》的多智能体挑战里塞进了一个会主动说谎的盟友。这个名为 SMAC-Talk 的基准测试，随后在 Qwen3.5 的四个型号上跑了一轮，结果没有一位选手胜率能跨过 72%。

SMAC-Talk 为已有的 StarCraft Multi-Agent Challenge 接入了一条自然语言通道。智能体不再只靠结构化的动作指令协调，它们要自己打字交流，共享战场信息。每一个智能体只掌控地图上的一个单位，视野碎片化，没有上帝视角。它们看不见完整战局，必须相互通报位置、敌我状态，并在彼此提供的情报上做出实时决策。而那个被刻意植入的欺骗型沟通者，会主动提供虚假敌情或错误的目标坐标，专门误导盟友。

测评一共覆盖 Qwen3.5 从 7B 到 72B 参数规模的四个模型，配合三种智能体架构。环境全程追踪三项指标：团队胜率、每局消息数、以及信任度——即智能体在多大程度上采信了真实陈述，又在多大程度上被谎言带偏。控制模式是完全去中心化的，没有一个中央大脑统一调度，每个智能体在本地跑自己的大语言模型推理循环，依据接收到的文字消息和局部观察做出动作。

欺骗场景对应了真实世界中 AI 智能体可能碰上被攻陷或敌对系统的风险。论文给出的数据显示，推理结构更强、记忆窗口更长的智能体在识别谎言时表现更好，但哪怕是最佳组合，面对一个撒谎的盟友，胜率始终没有突破 72%。参数规模的线性放大并没有换来欺骗检测能力的同步增长——Qwen3.5-72B 对比 7B，并未表现出压倒性的信任辨别优势。研究者判断，对于信任依赖型的协同任务，推理架构本身比模型大小更为关键。

当前主流智能体基准测试，例如 SWE-Bench 和 GAIA，围绕的是单个智能体在封闭任务上的完成度。SMAC-Talk 把焦点转向了多智能体之间的信任维度，这个维度在 LLM 评价中几乎被完全忽略。通过纯语言沟通过滤虚假信息的能力，在金融交易、军事协同或企业自动化流程中具备直接投射意义，因为恶意方很可能在这些通道里注入危险指令。一个能被盟友轻易骗过的智能体，在开放的生产环境中难以承担关键决策。

SMAC-Talk 的局限也摆在明处：它目前只支持《星际争霸》的场景设定，无法直接推演到其他交互形式。部分可观测条件与去中心化控制虽然更贴近真实部署环境，但单一游戏引擎的物理和规则约束，限制了欺骗模式与协同策略的多样性。研究团队尚未公开更多泛化任务上的对照实验。尽管如此，这个会发假情报的“队友”，已经让大模型在信任博弈中的真实抗压水平第一次被量化了出来。