打开网易新闻 查看精彩图片

MiniMax今天开源了M2.7模型,核心卖点是让模型深度参与自己的训练流程——相当于招了个能给自己写KPI、还能自己复盘优化的员工。

官方给出的数据很具体:SWE-Pro软件工程测试56.22%,VIBE-Pro完整项目交付55.6%,Terminal Bench 2系统理解57.0%。这些数字接近顶级闭源模型的水平,但M2.7的玩法不太一样。

所谓"自我进化",指的是内部系统能自动收集反馈、搭建评估集,持续调整自己的架构和记忆机制。优化编程能力时,它可以自主运行超过100轮循环,最终内部测试实现30%的性能提升。这有点像让厨师自己尝菜、自己改配方,直到满意为止。

另外配套的OpenRoom交互系统,把AI从纯文本对话拓展到了可视化界面,支持实时场景反馈。MiniMax的野心很明显:不只是做能聊天的模型,而是能做完整项目的Agent。

目前模型已上架Huggingface,API也同步开放。有意思的是,MiniMax刚在港股IPO拿到证监会备案,这节点开源旗舰模型,节奏卡得很准。

一位提前测试的开发者反馈,M2.7在处理跨文件代码重构时,会主动询问"这个函数的调用链是否需要一并调整"——这种"多嘴"的习惯,反而减少了后期返工。