MiniMax M2.5性能硬核突围，春节周调用量破3T领跑全球|agent|minimax|大模型|工作流|算法|编程|调用

这个春节，MiniMax在AI赛道上演强势突围，成为全球开发者圈的焦点。2月20日港股马年首个交易日，MiniMax收盘股价大涨14.52%，市值一度冲破3042亿港元，资本市场的热烈反应，背后是其新一代模型M2.5实打实的性能优势与市场表现。

M2.5登顶榜单，释放Agent需求

过去两年，AI行业的发展重心多集中在供给侧的技术升级，更强的模型、更快的芯片成为主流叙事，但市场中大量Agent相关需求却因技术与成本限制被长期压制。而MiniMax在春节假期前后推出的M2.5模型，恰好成为释放这部分需求的关键出口。这款为智能体场景原生设计的生产级旗舰模型，上线仅12小时就登顶OpenRouter热度榜，一周内更是拿下该平台调用量榜首，周调用量暴涨至3.07T tokens，这一数据直接超过Kimi K2.5、GLM-5与DeepSeek V3.2三家的总和。

更值得关注的是，M2.5还直接带动了OpenRouter平台100K至1M长文本区间的增量调用需求，而这一区间正是Agent工作流的典型消耗场景。此前众多开发者手握现成的Agent工作流却难以落地，核心原因就是找不到能力和成本双达标的模型，而Agent任务的token消耗远高于普通对话，需求一旦激活，带来的调用增量自然十分可观。M2.5的出现，恰好填补了这一市场空白，成为开发者落地Agent应用的优质选择。

硅谷的开发者生态，也早已对MiniMax的模型投出认可票。早在M2.1模型推出时，硅谷AI编程工具新贵Kilo Code——被公认为Cursor最强挑战者、可调用全球超500种模型——就将其设为核心产品的默认模型，其CEO直言，在真实编码工作流中，M2.1能与前沿模型媲美。此次M2.5发布后随即全面开源，模型权重在HuggingFace上线并支持本地部署，Kilo Code第一时间宣布接入，同时OpenCode、OpenClaw、Fireworks、魔搭社区等国内外知名开源Agent应用、工具平台，也纷纷同步接入，足见行业对其技术实力的认可。

技术评测中的亮眼表现，更是M2.5硬实力的直接证明。在编程领域权威的SWE-Bench Verified评测中，M2.5以80.2%的通过率达到Claude Opus系列同等水平，在多语言任务Multi-SWE-Bench上更是拿下排名第一的成绩。知名技术博主Simon Willison的独立测评中，M2.5在主流模型中排名第三，仅次于Claude Opus 4.5和Gemini 3 Flash，且是所有开源模型中的第一名。在执行效率上，研究机构SemiAnalysis实测显示，8张H200显卡上，M2.5在合理首token延迟内，每GPU每秒可稳定达到约2500个token的吞吐量，即便在严格的交互性要求下，处理超1万个token的上下文时，解码速度依旧稳定。

开源Agent社区的密集接入，还源于M2.5极具竞争力的定价，这直接决定了相关产品能否跑通商业逻辑。M2.5推出两个版本，100 TPS快速版输入每百万tokens仅0.3美元、输出2.4美元，50 TPS版本输出价格再降一半，精准落在开源社区能接受的成本区间。能力、速度、成本三大核心维度的同时达标，让M2.5在OpenRouter上走出了近乎指数型的增长曲线，成为市场的“香饽饽”。

定价优势显著，底层技术突破

M2.5的全方位突破，并非偶然，而是源于MiniMax从工程底层重新设计的原生Agent强化学习系统——代号Forge。此前多数RL框架存在工程复杂度高、训练推理一致性维护成本高的问题，Forge则通过引入中间件抽象层，将Agent执行逻辑与底层训练推理引擎彻底解耦，Gateway Server作为标准化通信网关隔离高层行为与模型复杂性，Data Pool异步收集训练轨迹，让生成与训练解耦，无需修改Agent内部代码，就能接入数百种框架、数千种工具调用格式训练。

在训练效率与稳定性上，Forge更是做了多重优化：引入Prefix Tree Merging方案，将训练样本从线性序列重构为树形结构，消除重复上下文前缀，实现约40倍训练加速，还大幅降低显存开销；提出Windowed FIFO异步调度策略，在最大化吞吐量的同时，控制样本离策略程度，兼顾效率与稳定；算法层面，沿用自研CISPO算法保障MoE模型大规模训练稳定性，针对Agent长轨迹信用分配难题，设计过程奖励、任务完成时间奖励、Reward-to-Go复合奖励机制，还将上下文管理整合进RL交互循环，从根本上解决长程任务的注意力稀释问题。正是这套底层系统，让M2.5能在Kilo、OpenClaw等对模型要求严苛的Agent框架上稳定表现。

MiniMax的技术迭代速度，更是让行业侧目。在过去108天里，其陆续推出M2、M2.1、M2.5三款模型，在SWE-Bench Verified榜单上，M2系列的进步速度远超Claude、GPT、Gemini系列，成为行业迭代最快的模型系列。而这一迭代节奏，恰好踩中了全球Agent需求爆发的窗口，OpenClaw从默默无闻到席卷全球仅用一两个月，如今OpenRouter平台上已有上千种同类AI工具和应用生长，在ChatGPT、Claude、Gemini“御三家”之外的这片新生态里，开发者的评判标准只有一个：模型跑不跑得通、用不用得起。

MiniMax M2.5的出现，正是精准击穿了性能与成本的临界点：能力跻身全球第一梯队，价格仅为主流旗舰模型的十分之一，还支持本地部署。这不仅让自身收获了3T tokens的周调用量，更让开源社区里那些原本只存在于Demo中的复杂多Agent系统，第一次具备了大规模商业落地的经济可行性。这一数字的背后，是全球开发者用脚投出的认可，不仅是M2.5模型的增量，更是硅谷下一代开源生态应用的增量，也意味着被压制许久的全球Agent需求，正迎来真正的爆发时刻。