MiniMax最新模型开源，华为、英伟达等芯片厂商齐站台|minimax|知名企业|英伟达

MiniMax最新模型开源，华为、英伟达等芯片厂商齐站台

南方都市报

2026-04-13 13:50 ·广东 ·南方都市报官方网易号

4月12日晚，MiniMax正式在全球开源其M2.7大模型，并携华为昇腾、摩尔线程、沐曦、昆仑芯、英伟达，以及Together AI、Fireworks、Ollama等海内外芯片厂商、推理平台，在开源首日即完成模型接入与推理适配工作。

随着行业发展，主流大模型的能力差距正在逐步缩小，企业的核心需求已不再是拥有最好的模型，而是如何通过模型的Harness，也即“大模型的脚手架”，包括工具调用、分层上下文工程、长记忆管理、工作流设计等系统工程手段，在不改变模型架构和参数的基础上，把模型能力最大程度发挥出来。

三周前，MiniMax M2.7已率先上线。MiniMax M2.7的一大亮点，即自行构建Agent Harness，把思考和执行两个领域的功能揉在一起，这使得M2.7成为业界第一个能让AI深度参与迭代自己的模型。此外，M2.7基于Agent Teams、复杂Skills、Tool Search tool等能力，完成高度复杂的生产力任务。这意味着模型能自己直接开启了自我进化之路。

据了解，基于在真实的软件工程、专业办公场景的表现，M2.7已成为Hermes Agent、OpenClaw等全球热门智能体中最受欢迎的模型之一。来自海内外的开发者与企业客户的接入需求在持续增长，模型调用量在快速提升。

在开源当日，华为昇腾AI基础软硬件实现首日适配，基于vllm-Ascend推理引擎在Atlas 800 A3、Atlas 800I A2系列产品上为模型的推理部署提供全流程支持；摩尔线程技术团队基于MUSA架构，针对M2.7的模型特点完成深度调优，成功在MTT S5000上实现模型的的高性能推理；沐曦曦云C系列GPU凭借全栈自研的MXMACA软件栈，首日完成深度适配，实现“模型发布即算力就绪”的Day 0体验；昆仑芯依托自研架构，通过底层算子优化与软硬件协同加速；英伟达（NVIDIA）推理框架TensorRT-LLM为M2.7提供了深度适配与全面优化支持，帮助开发者和企业用户高效完成模型的部署与上线。

近期，国产大模型密集上新。4月13日，全球大模型聚合路由平台OpenRouter显示，上周（4.6-4.12）全球模型调用量中，5大模型总共占据调用量5.22T，占总调用量近25%。