MiniMax M3登场：编程跑分超GPT-5.5，百万token上下文，10天内开源|minimax|token|上下文|开源模型|编程

在SWE Bench Pro测试中，一个由中国团队打造的模型把GPT-5.5和Gemini 3.1 Pro甩在了身后；SVG图像生成评测里，它又压过了Claude Opus 4.7。这座诞生于上海AI公司MiniMax的新模型M3，用一份亮眼的基准成绩单，直接摆开了与当今最强闭源模型正面对比的架势。

MiniMax对M3的定位异常清晰——“首个同时具备顶级编程智能体能力、100万token原生上下文窗口、以及多模态输入的开放模型”。公司强调，这三项能力已经是前沿闭源模型的标配，但一直没有一个开放模型把它们全部集成在一起。现在M3把这三张牌凑齐，而且承诺发布后10天内就以开放模型的形式分发。

这背后是一套被称为“稀疏注意力”的架构。MiniMax称，在处理100万token时，M3所需计算量仅为前代模型的二十分之一。落到速度上，预填充阶段提升了超过9倍，解码阶段提速超过15倍。换句话说，开源社区将拿到一个能一次吞下整部《三体》三部曲、同时理解图像和视频，还不必担心算力被锁死的模型。

基准测试的对比列表把几大闭源巨头的当家模型拉到同一张表格里。在评估软件工程能力的SWE Bench Pro上，M3领先GPT-5.5和Gemini 3.1 Pro；在SVG Bench中，它排到了Claude Opus 4.7之上。更值得琢磨的是CUDA内核优化的迭代测试——横轴是迭代次数，纵轴是硬件峰值利用率。多数开放模型优化到一定程度就撞上天花板，而M3持续攀升，最终超越Claude Opus 4.7的优化度。代价是优化耗时约为Claude Opus 4.7的两倍，但它证明了一件事：开放模型在极致工程调优上，可以追上甚至反超闭源对手。

API的定价策略同时瞄准了轻量调用和重度集成。处理51.2万token以内的输入，每百万token收费0.60美元，输出2.40美元，缓存读取仅0.12美元；超过51.2万token后单价翻倍。如果用量足够大，MiniMax还给出了订阅套餐：月付20美元的Plus版提供17亿token，50美元的Max版给51亿token，120美元的Ultra版则补贴到98亿token。这个梯度设计显然是在鼓励高频使用者从按量付费转向包月，降低长期接入的门槛。

一个能正面硬撼GPT-5.5和Claude Opus 4.7的模型，选择不做闭源API孤岛，而是把完整权重开放给所有人——这种做法放在2026年的今天，仍然让整个行业感到困惑。究竟是技术自信到了不需要靠封闭来维持竞争优势，还是算力分发模式的转变已经让“开放”本身变成了更聪明的围墙？至少，MiniMax用M3给出的回答是：不站队，直接上数据，让代码跑分说话。