6月12日,MiniMax正式开源新一代原生多模态旗舰模型MiniMax M3。同日,摩尔线程宣布,旗下旗舰级AI训推一体智算卡MTT S5000已完成对该模型的Day-0适配,开发者可基于MUSA软件栈以及vLLM、SGLang两大推理框架进行部署。

MiniMax M3定位为国内首个同时具备前沿Coding与Agent能力、超长上下文和原生多模态能力的开源模型。该模型采用自研MSA(MiniMax Sparse Attention)架构,将上下文窗口扩展至100万Token级别,并在BrowseComp、SWE-Bench Pro等评测中取得领先成绩。

打开网易新闻 查看精彩图片

MiniMax M3的Coding & Agentic能力在软件工程、终端执行、工具调用等多维度权威评测中的结果

针对M3超长上下文、高性能推理和原生多模态等特性,摩尔线程对硬件与软件栈进行了针对性优化。MTT S5000支持原生FP8计算,单卡稠密算力达1000 TFLOPS,配备80GB显存和1.6TB/s显存带宽,以满足百万级Token推理对KV Cache和访存能力的需求。

在推理生态层面,摩尔线程同步完成vLLM与SGLang框架适配,并通过算子级优化提升推理吞吐率、降低响应延迟。此前,摩尔线程已实现对DeepSeek-V4、MiniMax M2.7、GLM-5.1等国产大模型的Day-0适配。(袁宁)