硅谷血战Agent，MiniMax竟把主动权交了出去|agent|minimax|上下文|底层逻辑|硅谷

五月某个周三下午，研发工程师择因决定不等M3模型了。他把Agent Team——一套Leader-Worker-Verifier“对抗式”多智能体编排架构——在M2.7上直接推给了用户。一个月后，MiniMax Code带着这套架构杀进市场，订阅量涨得让团队觉得这一步走对了。

“不用非等到和新模型一起发，是我们的意愿，也是自己的节奏。”择因告诉APPSO，Agent Team在他们内部已经用了一个月。“一个月已经很久了”——在Agent赛道上，这话没有夸张成分。四月还叫山雨欲来，五月已经血雨腥风。Claude Code、Codex、Cursor贴身肉搏，Trae、Qoder、CodeBuddy杀成一团。连低调的DeepSeek都挂出了多岗位招聘，组建Agent开发队伍。

模型本身已卷到几近平直，拉开距离的是外面那层壳。一份拆解Claude Code泄露代码的报告显示：真正属于模型决策的部分只有1.6%，剩下98.4%全在管权限、管上下文、兜错。去年还在谈skill，今年harness站上了王座。择因的判断很直接：“模型之间仍然存在差距，但拉开模型公司之间真正差距的，早已不再是模型本身，而是套在外面的那层壳。”

Agent Team瞄准的正是长程任务中那些头部顽疾。架构把干活和挑错的职责拆给了不同Agent，用代码逻辑固化的状态机来管理，上下文彼此隔离。择因说，这剂药治的是“上下文污染、上下文焦虑、Agent之间的‘共谋’”。有意思的是，MiniMax用户还找到了他们没预料到的玩法——全模态能力让古文爱好者拿Agent Team批量生成诗朗诵音频，也有人用它做长视频。

“很多用户告诉我们，当Agent Team被整个拉起来开始干活的感觉，给他们带来很大情绪价值，真的像是有了几个员工给自己打工。”择因承认，腾讯Marvis的“打工感”更强，但整个多Agent产品赛道，“大家都跟得很紧”。

业界正流传一个判断：Anthropic拥有最好的模型和最烂的工程。择因的解读是，Anthropic骨子里不信任模型，预设它会作弊、耍小聪明，于是处处约束。OpenAI走的是另一条路——harness核心是个极简的agentic loop。一个约束极强的框架养出了遵循度极好的模型，一个极简框架却可能碰上“黑天鹅”。MiniMax选择了融合：相信模型，给它和人一样的操作权限，同时在脚手架里加入合理约束。

但择因不认为MiniMax在Agent上有壁垒——“没有任何人有”。他发给APPSO一篇71页的论文：“关于Agent的所有东西，都在这篇论文里了。如果一篇就能说清楚，还有什么壁垒？”MiniMax的绝活是另一套逻辑：以最快速度向行业输出新认知，抢做共识的领导者、执行者、验证者。整个Agent Team架构公开发布，M3都不等，内测一个月够用就推。

订阅逻辑理顺后，下载和订阅量出现“可观的增长”。择因觉得这验证了MiniMax的思路：如果只提供API，用户使用模型的门槛高，效果也不是最佳。“MiniMax Code能让大家直接感受到模型的完全体。”用户拿它做视频的方式让他看到另一种可能——偏个人兴趣向的制作已经可行，专业工业生产仍需分工，但“随着模型能力提升，抽卡成本以及后续剪辑成本，会降得非常低”。他们调研发现，今天请剪辑师剪视频比AI便宜，有服务商甚至把抽卡和剪辑打包，找大学生上课当作业做来压低人力成本。

对话的结尾，APPSO抛出一个开放性问题。择因的回答指向了一个具体的时间节点：当Agent可以实现真正的自进化，在几乎所有数字或物理任务上效率与成本都优于人类。从站在第一线的视角来看，他说，“我们离那个未来并不遥远。”