在SWE Bench Pro测试中,一个由中国团队打造的模型把GPT-5.5和Gemini 3.1 Pro甩在了身后;SVG图像生成评测里,它又压过了Claude Opus 4.7。这座诞生于上海AI公司MiniMax的新模型M3,用一份亮眼的基准成绩单,直接摆开了与当今最强闭源模型正面对比的架势。
MiniMax对M3的定位异常清晰——“首个同时具备顶级编程智能体能力、100万token原生上下文窗口、以及多模态输入的开放模型”。公司强调,这三项能力已经是前沿闭源模型的标配,但一直没有一个开放模型把它们全部集成在一起。现在M3把这三张牌凑齐,而且承诺发布后10天内就以开放模型的形式分发。
这背后是一套被称为“稀疏注意力”的架构。MiniMax称,在处理100万token时,M3所需计算量仅为前代模型的二十分之一。落到速度上,预填充阶段提升了超过9倍,解码阶段提速超过15倍。换句话说,开源社区将拿到一个能一次吞下整部《三体》三部曲、同时理解图像和视频,还不必担心算力被锁死的模型。
基准测试的对比列表把几大闭源巨头的当家模型拉到同一张表格里。在评估软件工程能力的SWE Bench Pro上,M3领先GPT-5.5和Gemini 3.1 Pro;在SVG Bench中,它排到了Claude Opus 4.7之上。更值得琢磨的是CUDA内核优化的迭代测试——横轴是迭代次数,纵轴是硬件峰值利用率。多数开放模型优化到一定程度就撞上天花板,而M3持续攀升,最终超越Claude Opus 4.7的优化度。代价是优化耗时约为Claude Opus 4.7的两倍,但它证明了一件事:开放模型在极致工程调优上,可以追上甚至反超闭源对手。
API的定价策略同时瞄准了轻量调用和重度集成。处理51.2万token以内的输入,每百万token收费0.60美元,输出2.40美元,缓存读取仅0.12美元;超过51.2万token后单价翻倍。如果用量足够大,MiniMax还给出了订阅套餐:月付20美元的Plus版提供17亿token,50美元的Max版给51亿token,120美元的Ultra版则补贴到98亿token。这个梯度设计显然是在鼓励高频使用者从按量付费转向包月,降低长期接入的门槛。
一个能正面硬撼GPT-5.5和Claude Opus 4.7的模型,选择不做闭源API孤岛,而是把完整权重开放给所有人——这种做法放在2026年的今天,仍然让整个行业感到困惑。究竟是技术自信到了不需要靠封闭来维持竞争优势,还是算力分发模式的转变已经让“开放”本身变成了更聪明的围墙?至少,MiniMax用M3给出的回答是:不站队,直接上数据,让代码跑分说话。
热门跟贴