发布新一代大模型M3，MiniMax看到了下一个新风口|minimax|上下文|大模型|模态

现在，大模型赛道的竞争，早已从传统意义上的拼参数，进入到了拼落地、拼应用的全新阶段。对于很多的玩家们来讲，谁能够找到落地和应用的新方式，谁能够找到实现商业化的正确路径，谁就能够在这样一个全新的周期里占得先机。6月1日，国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。透过M3，我们不仅可以看到国产大模型公司的领先，更加看到了下一个全新的风口。

资料显示，M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention（MSA），相较传统全注意力机制，MSA能够显著降低长上下文下的计算成本，并将上下文窗口提升至100万token（词元）。

据悉，M3是国内首个同时具备“前沿 Coding 能力、1M超长上下文、原生多模态”三项核心能力的大模型，也是目前全球唯一具备完整能力组合的开源选项。

随着M3的发布，MiniMax不仅可以进一步巩固自身在大模型赛道上的地位，同样将会为即将到来的“A+H”上市筑牢技术的护城河。那么，透过MiniMax的M3，我们可以看出当下的大模型赛道呈现出来了怎样的一种竞争态势？随着商业化的进一步加速，未来的大模型风口究竟将会在怎样的方向上呢？

大模型赛道的竞争重点正转向底层

以往，谈及大模型赛道的竞争，玩家们通常会比拼参数和跑分，通常会比拼表层的功能。然而，随着大模型赛道的竞争日渐白热化，特别是随着以MiniMax为代表的玩家们开始登陆到了更大的资本市场上，大模型赛道竞争的重点开始从表层转向了底层，开始从参数转向了架构。因此，MiniMax发布新一代的模型M3所带给我们的一个最为突出的启示，便是大模型赛道的竞争重点正在转向底层。

拿M3来讲，它之所以会有如此重要的地位，最为关键的一点就在于，它从底层改变了原有的底层架构。其自研的稀疏注意力架构MSA(MiniMax Sparse Attention)，相较传统全注意力机制，MSA能够显著降低长上下文下的计算成本，并将上下文窗口提升至100万token。这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时，能够在一次推理中保留更完整的信息链路。MiniMax披露，在100万上下文规模下，M3单token计算量仅为上一代模型的约1/20，推理效率显著提升。

如果我们将以往的大模型赛道的竞争，看成是一种横向的竞争的话，那么，现在的大模型赛道的竞争，更像是一种纵向的竞争。在这样一种全新的竞争机制之下，谁能够从底层深度改变大模型本身，谁能够由下而上地为大模型注入新的生机与活力，谁就能够在新一轮的竞争当中获胜。

其实，并不仅仅只有MiniMax，百度、谷歌都加入到了新的底层架构的竞争之中。以百度为例，百度文心大模型规模化采用 ‌MoE（Mixture of Experts）架构‌（如 128 专家路由），在保持千亿级参数下仅激活部分专家，训练效率提升 40%，兼顾能力与推理成本。

大模型不再考验单一能力，多模态混合才是关键

现在的大模型赛道，有些玩家们专注于文本处理的能力，有些玩家们则专注于视频生成的能力。说到底，以往大模型赛道的玩家们走的是单点突破的路线。在这个过程当中，我们看到了可灵AI的强势崛起，我们看到了月之暗面的一骑绝尘。然而，随着大模型赛道的竞争进入到全新的发展阶段，仅仅只是以单一的能力来应对当下的市场，开始显得愈发地捉襟见肘。

通过MiniMax的M3模型，我们可以看出的是一个全新的风口正在打开，即，大模型赛道的竞争已经不再仅仅只是考验单点突破的能力，而是开始更多地考验跨文本、图片、视频的多模态混合的能力。MiniMax M3从训练起点便采用文本、图片、视频等多模态混合训练，并在数据规模和训练管线上进一步扩展。模型不仅支持图像与视频理解，也具备桌面操作能力，可在复杂跨应用环境中执行Computer Use任务。

MiniMax强调，Interleaved data(交错数据)——文本和图像等其他模态在序列中交替自然排列的数据——对模型性能带来的提升，比一般认为的更加关键。在为这些数据重构整套数据管线后，MiniMax已可以将训练数据Token规模提升至100万亿的量级。

显而易见的是，现在大模型赛道的玩家们早已不再仅仅只是局限于简单意义上的语义理解，而是更加朝着多模态混合的方向发展，并且实现不同应用之间的协同配合。对于玩家们而言，不断地实现单点突破，并且实现多模态的混合，实现跨领域的协同和执行，真正让大模型落地到更多的生产力场景之中，才是下一轮竞争的关键所在。

大模型正在从外部输血转向独立行走

随着大模型赛道的竞争进入到深水区，特别是随着商业模式的日渐成熟，应用场景的逐渐丰富，仅仅只是依靠外部输血的方式开始遭遇到越来越多的挑战。无论是对于巨头玩家们的大模型来讲，还是走资本路线的玩家们来讲，充足的现金流以及可持续的商业化变现的能力，才是确保自身可以走得长远的关键要素。

拿MiniMax的M3来说，它为我们透露出来的一个最为重要的信息，就是它开始越来越多地走向生产层，走向应用环境之中。资料显示，M3的Coding&Agentic能力明显提升，在涵盖软件工程、终端执行、效率与协议理解等多个维度的国际权威评测中，均达到国际领先水平：在衡量Coding能力的SWE-Bench Pro上，MiniMax M3超过GPT-5.5和Gemini 3.1 Pro，接近Opus 4.7。在综合评估SVG生成性能的基准SVG-Bench上，MiniMax M3超过Opus 4.7。

据介绍，M3在编程与Agent训练中创新引入交互式用户模拟器框架——通过模拟真实开发者在协作过程中的行为模式，让模型在训练和评测阶段就接触到更接近生产环境的交互场景。

伴随着M3的发布，MiniMax同步推出Token Plan订阅方案。Plus版每月49元，提供6亿token;Max版每月119元，提供18亿token;Ultra版每月469元，提供55亿token。

无论是从代码开发、研究分析，还是从跨应用的协同，以及同步推出的Token Plan订阅方案，其实，现在考验大模型玩家们的是如何将大模型应用到更多的生产力场景之中来进行表现的能力，以此来达到自我造血的目的。这一点，我们同样可以从可灵AI的身上，看出一丝端倪。

根据快手公布的财报显示，截至2026年第一季度（Q1），可灵AI收入超6.5亿元人民币，同比增长超300%；2026年3月年化收入（ARR）近5亿美元，较2025年3月的1亿美元增长4倍。正是因为可灵AI的自我造血能力的进一步增强，因此，可灵AI传出了分拆上市的消息。

而快手方面则发布公告称，本公司注意到于2026年5月11日有媒体报道本公司有意就可灵AI相关资产及业务获取外部融资及拟议独立上市。为了进一步利用外部财务资源，本公司董事会正在评估拟议重组可灵AI之相关资产及业务的方案，其中或涉及引入外部融资。截至本公告日，上述拟议方案仍处于初步阶段，本公司尚未就此签署任何最终协议。概不保证该等拟议方案将会进行。

无论怎样，现在大模型赛道的竞争，正在从以往的外部输血，转向到了更多的独立行走和自我造血全新方向上。无论是对于MiniMax这样的创业型玩家们而言，还是对于可灵AI这样诞生于巨头的玩家们来讲，独立行走，自我造血才是下一个重要的方向。

结语

随着MiniMax M3的发布，国产大模型的技术硬实力再一次得到了体现。除此之外，我们还应该看到的是，当下大模型赛道的竞争业已从传统意义上的基于参数的横向角度的竞争，转移到了基于架构等要素的纵向角度的竞争。在此影响之下，对于玩家们的能力的考验同样从单点转移到了多模态混合的层面上，而玩家们的商业化的能力，同样成为了决定它们未来市场地位的关键所在。像MiniMax一样做好下一个风口的布局，找到适合这个新周期里的飞行姿势，才是真正地掌握主动权。