五月某个周三下午,研发工程师择因决定不等M3模型了。他把Agent Team——一套Leader-Worker-Verifier“对抗式”多智能体编排架构——在M2.7上直接推给了用户。一个月后,MiniMax Code带着这套架构杀进市场,订阅量涨得让团队觉得这一步走对了。
“不用非等到和新模型一起发,是我们的意愿,也是自己的节奏。”择因告诉APPSO,Agent Team在他们内部已经用了一个月。“一个月已经很久了”——在Agent赛道上,这话没有夸张成分。四月还叫山雨欲来,五月已经血雨腥风。Claude Code、Codex、Cursor贴身肉搏,Trae、Qoder、CodeBuddy杀成一团。连低调的DeepSeek都挂出了多岗位招聘,组建Agent开发队伍。
模型本身已卷到几近平直,拉开距离的是外面那层壳。一份拆解Claude Code泄露代码的报告显示:真正属于模型决策的部分只有1.6%,剩下98.4%全在管权限、管上下文、兜错。去年还在谈skill,今年harness站上了王座。择因的判断很直接:“模型之间仍然存在差距,但拉开模型公司之间真正差距的,早已不再是模型本身,而是套在外面的那层壳。”
Agent Team瞄准的正是长程任务中那些头部顽疾。架构把干活和挑错的职责拆给了不同Agent,用代码逻辑固化的状态机来管理,上下文彼此隔离。择因说,这剂药治的是“上下文污染、上下文焦虑、Agent之间的‘共谋’”。有意思的是,MiniMax用户还找到了他们没预料到的玩法——全模态能力让古文爱好者拿Agent Team批量生成诗朗诵音频,也有人用它做长视频。
“很多用户告诉我们,当Agent Team被整个拉起来开始干活的感觉,给他们带来很大情绪价值,真的像是有了几个员工给自己打工。”择因承认,腾讯Marvis的“打工感”更强,但整个多Agent产品赛道,“大家都跟得很紧”。
业界正流传一个判断:Anthropic拥有最好的模型和最烂的工程。择因的解读是,Anthropic骨子里不信任模型,预设它会作弊、耍小聪明,于是处处约束。OpenAI走的是另一条路——harness核心是个极简的agentic loop。一个约束极强的框架养出了遵循度极好的模型,一个极简框架却可能碰上“黑天鹅”。MiniMax选择了融合:相信模型,给它和人一样的操作权限,同时在脚手架里加入合理约束。
但择因不认为MiniMax在Agent上有壁垒——“没有任何人有”。他发给APPSO一篇71页的论文:“关于Agent的所有东西,都在这篇论文里了。如果一篇就能说清楚,还有什么壁垒?”MiniMax的绝活是另一套逻辑:以最快速度向行业输出新认知,抢做共识的领导者、执行者、验证者。整个Agent Team架构公开发布,M3都不等,内测一个月够用就推。
订阅逻辑理顺后,下载和订阅量出现“可观的增长”。择因觉得这验证了MiniMax的思路:如果只提供API,用户使用模型的门槛高,效果也不是最佳。“MiniMax Code能让大家直接感受到模型的完全体。”用户拿它做视频的方式让他看到另一种可能——偏个人兴趣向的制作已经可行,专业工业生产仍需分工,但“随着模型能力提升,抽卡成本以及后续剪辑成本,会降得非常低”。他们调研发现,今天请剪辑师剪视频比AI便宜,有服务商甚至把抽卡和剪辑打包,找大学生上课当作业做来压低人力成本。
对话的结尾,APPSO抛出一个开放性问题。择因的回答指向了一个具体的时间节点:当Agent可以实现真正的自进化,在几乎所有数字或物理任务上效率与成本都优于人类。从站在第一线的视角来看,他说,“我们离那个未来并不遥远。”
热门跟贴