这个春节,MiniMax在AI赛道上演强势突围,成为全球开发者圈的焦点。2月20日港股马年首个交易日,MiniMax收盘股价大涨14.52%,市值一度冲破3042亿港元,资本市场的热烈反应,背后是其新一代模型M2.5实打实的性能优势与市场表现。

打开网易新闻 查看精彩图片

M2.5登顶榜单,释放Agent需求

过去两年,AI行业的发展重心多集中在供给侧的技术升级,更强的模型、更快的芯片成为主流叙事,但市场中大量Agent相关需求却因技术与成本限制被长期压制。而MiniMax在春节假期前后推出的M2.5模型,恰好成为释放这部分需求的关键出口。这款为智能体场景原生设计的生产级旗舰模型,上线仅12小时就登顶OpenRouter热度榜,一周内更是拿下该平台调用量榜首,周调用量暴涨至3.07T tokens,这一数据直接超过Kimi K2.5、GLM-5与DeepSeek V3.2三家的总和。

打开网易新闻 查看精彩图片

更值得关注的是,M2.5还直接带动了OpenRouter平台100K至1M长文本区间的增量调用需求,而这一区间正是Agent工作流的典型消耗场景。此前众多开发者手握现成的Agent工作流却难以落地,核心原因就是找不到能力和成本双达标的模型,而Agent任务的token消耗远高于普通对话,需求一旦激活,带来的调用增量自然十分可观。M2.5的出现,恰好填补了这一市场空白,成为开发者落地Agent应用的优质选择。

打开网易新闻 查看精彩图片

硅谷的开发者生态,也早已对MiniMax的模型投出认可票。早在M2.1模型推出时,硅谷AI编程工具新贵Kilo Code——被公认为Cursor最强挑战者、可调用全球超500种模型——就将其设为核心产品的默认模型,其CEO直言,在真实编码工作流中,M2.1能与前沿模型媲美。此次M2.5发布后随即全面开源,模型权重在HuggingFace上线并支持本地部署,Kilo Code第一时间宣布接入,同时OpenCode、OpenClaw、Fireworks、魔搭社区等国内外知名开源Agent应用、工具平台,也纷纷同步接入,足见行业对其技术实力的认可。

技术评测中的亮眼表现,更是M2.5硬实力的直接证明。在编程领域权威的SWE-Bench Verified评测中,M2.5以80.2%的通过率达到Claude Opus系列同等水平,在多语言任务Multi-SWE-Bench上更是拿下排名第一的成绩。知名技术博主Simon Willison的独立测评中,M2.5在主流模型中排名第三,仅次于Claude Opus 4.5和Gemini 3 Flash,且是所有开源模型中的第一名。在执行效率上,研究机构SemiAnalysis实测显示,8张H200显卡上,M2.5在合理首token延迟内,每GPU每秒可稳定达到约2500个token的吞吐量,即便在严格的交互性要求下,处理超1万个token的上下文时,解码速度依旧稳定。

打开网易新闻 查看精彩图片

开源Agent社区的密集接入,还源于M2.5极具竞争力的定价,这直接决定了相关产品能否跑通商业逻辑。M2.5推出两个版本,100 TPS快速版输入每百万tokens仅0.3美元、输出2.4美元,50 TPS版本输出价格再降一半,精准落在开源社区能接受的成本区间。能力、速度、成本三大核心维度的同时达标,让M2.5在OpenRouter上走出了近乎指数型的增长曲线,成为市场的“香饽饽”。

定价优势显著,底层技术突破

M2.5的全方位突破,并非偶然,而是源于MiniMax从工程底层重新设计的原生Agent强化学习系统——代号Forge。此前多数RL框架存在工程复杂度高、训练推理一致性维护成本高的问题,Forge则通过引入中间件抽象层,将Agent执行逻辑与底层训练推理引擎彻底解耦,Gateway Server作为标准化通信网关隔离高层行为与模型复杂性,Data Pool异步收集训练轨迹,让生成与训练解耦,无需修改Agent内部代码,就能接入数百种框架、数千种工具调用格式训练。

打开网易新闻 查看精彩图片

在训练效率与稳定性上,Forge更是做了多重优化:引入Prefix Tree Merging方案,将训练样本从线性序列重构为树形结构,消除重复上下文前缀,实现约40倍训练加速,还大幅降低显存开销;提出Windowed FIFO异步调度策略,在最大化吞吐量的同时,控制样本离策略程度,兼顾效率与稳定;算法层面,沿用自研CISPO算法保障MoE模型大规模训练稳定性,针对Agent长轨迹信用分配难题,设计过程奖励、任务完成时间奖励、Reward-to-Go复合奖励机制,还将上下文管理整合进RL交互循环,从根本上解决长程任务的注意力稀释问题。正是这套底层系统,让M2.5能在Kilo、OpenClaw等对模型要求严苛的Agent框架上稳定表现。

打开网易新闻 查看精彩图片

MiniMax的技术迭代速度,更是让行业侧目。在过去108天里,其陆续推出M2、M2.1、M2.5三款模型,在SWE-Bench Verified榜单上,M2系列的进步速度远超Claude、GPT、Gemini系列,成为行业迭代最快的模型系列。而这一迭代节奏,恰好踩中了全球Agent需求爆发的窗口,OpenClaw从默默无闻到席卷全球仅用一两个月,如今OpenRouter平台上已有上千种同类AI工具和应用生长,在ChatGPT、Claude、Gemini“御三家”之外的这片新生态里,开发者的评判标准只有一个:模型跑不跑得通、用不用得起。

打开网易新闻 查看精彩图片

MiniMax M2.5的出现,正是精准击穿了性能与成本的临界点:能力跻身全球第一梯队,价格仅为主流旗舰模型的十分之一,还支持本地部署。这不仅让自身收获了3T tokens的周调用量,更让开源社区里那些原本只存在于Demo中的复杂多Agent系统,第一次具备了大规模商业落地的经济可行性。这一数字的背后,是全球开发者用脚投出的认可,不仅是M2.5模型的增量,更是硅谷下一代开源生态应用的增量,也意味着被压制许久的全球Agent需求,正迎来真正的爆发时刻。