4月12日晚,MiniMax正式在全球开源其M2.7大模型,并携华为昇腾、摩尔线程、沐曦、昆仑芯、英伟达,以及Together AI、Fireworks、Ollama等海内外芯片厂商、推理平台,在开源首日即完成模型接入与推理适配工作。

打开网易新闻 查看精彩图片

随着行业发展,主流大模型的能力差距正在逐步缩小,企业的核心需求已不再是拥有最好的模型,而是如何通过模型的Harness,也即“大模型的脚手架”,包括工具调用、分层上下文工程、长记忆管理、工作流设计等系统工程手段,在不改变模型架构和参数的基础上,把模型能力最大程度发挥出来。

三周前,MiniMax M2.7已率先上线。MiniMax M2.7的一大亮点,即自行构建Agent Harness,把思考和执行两个领域的功能揉在一起,这使得M2.7成为业界第一个能让AI深度参与迭代自己的模型。此外,M2.7基于Agent Teams、复杂Skills、Tool Search tool等能力,完成高度复杂的生产力任务。这意味着模型能自己直接开启了自我进化之路。

据了解,基于在真实的软件工程、专业办公场景的表现,M2.7已成为Hermes Agent、OpenClaw等全球热门智能体中最受欢迎的模型之一。来自海内外的开发者与企业客户的接入需求在持续增长,模型调用量在快速提升。

在开源当日,华为昇腾AI基础软硬件实现首日适配,基于vllm-Ascend推理引擎在Atlas 800 A3、Atlas 800I A2系列产品上为模型的推理部署提供全流程支持;摩尔线程技术团队基于MUSA架构,针对M2.7的模型特点完成深度调优,成功在MTT S5000上实现模型的的高性能推理;沐曦曦云C系列GPU凭借全栈自研的MXMACA软件栈,首日完成深度适配,实现“模型发布即算力就绪”的Day 0体验;昆仑芯依托自研架构,通过底层算子优化与软硬件协同加速;英伟达(NVIDIA)推理框架TensorRT-LLM为M2.7提供了深度适配与全面优化支持,帮助开发者和企业用户高效完成模型的部署与上线。

近期,国产大模型密集上新。4月13日,全球大模型聚合路由平台OpenRouter显示,上周(4.6-4.12)全球模型调用量中,5大模型总共占据调用量5.22T,占总调用量近25%。

打开网易新闻 查看精彩图片

OpenRouter显示,上周最受欢迎模型榜前十名中,国产大模型占一半,阿里Qwen3.6 Plus、DeepSeek V3.2、MiniMax M2.7、MiniMax M2.5、小米MiMo-V2-Pro榜上有名。

采写:南都N视频记者 林文琪