来源:市场资讯

(来源:华为计算)

2026年4月12日,MiniMax正式开源其第一个自我深度迭代的模型MiniMax M2.7。昇腾一直同步支持MiniMax M2系列模型,此次M2.7模型一经开源发布,昇腾AI基础软硬件即实现0 Day适配,可基于vllm Ascend在Atlas 800 A3、Atlas 800I A2系列产品上为该模型的推理部署提供全流程支持。

MiniMax M2.7能够自行构建复杂Agent Harness,并基于Agent Teams、复杂Skills、Tool Search Tool等能力,完成高度复杂的生产力任务。在研发过程中,MiniMax基于模型构建强化学习Harness中的数十个复杂的skills,更新自己的memory,驱动模型自身的强化学习,并基于结果优化强化学习过程和Harness,开启模型的自我进化。

昇腾持续加速算子和基础软硬件创新,匹配MiniMax M2.7模型创新的FlashComm序列切分,AllReduce换成ReduceScatter和AllGather通信加速;深度优化的Transformer Attention前序全链路融合算子和MoE大融合算子,彻底消除中间张量读写和多算子调度开销;同时在多DP并发场景下,自适应DP域负载均衡,大幅降低prefill对decode的抢断,显著提升重载忙时的吞吐性能,让广大用户和开发者畅享MiniMax M2.7新体验。

体验指导链接:

https://docs.vllm.ai/projects/ascend/en/v0.18.0/tutorials/models/index.html

代码仓:

https://github.com/vllm-project/vllm-ascend/tree/releases/v0.18.0

打开网易新闻 查看精彩图片

构建模型自我进化智能体:MiniMax团队在开发过程中,研究员将M2的早期版本引导为一个研究型Agent Harness来参与下一代模型的迭代循环,它能够与不同的研究项目组进行交互和协作,研究员在每一层引导方向,模型在每一层负责构建,研究员只需在关键决策和讨论时介入。通过Agent驱动,大幅加速了问题发现和实验迭代,从而更快地交付模型。部分RL场景下,M2.7能够胜任30-50%的工作流

软件工程领域:M2.7更深入地打磨了真实软件工程所需的编程能力,覆盖日志分析与Bug定位、代码重构、代码安全、机器学习、安卓开发等方向。在涵盖多种编程语言的基准测试SWE-Pro中M2.7以56.22%的正确率追平GPT-5.3-Codex;而在更贴近真实工程场景的SWE Multilingual(76.5)和Multi SWE Bench(52.7)中展现出更显著优势。

专业办公领域:M2.7模型提升了专业知识和任务交付能力,在GDPval-AA得分为开源最高;并且具备与复杂环境交互的能力,在40个复杂skills(>2000 Token)的case上,仍能保持97%的skills遵循率。

互动娱乐领域:M2.7构建了一个Agent交互系统OpenRoom,它将AI互动置入一个万物皆可互动的Web GUI空间,极大加强了人设保持和对话能力,并且能够随着模型Agentic能力的提升和社区共建持续进化。

打开网易新闻 查看精彩图片