来源:上海证券报·中国证券网
2月11日,智谱正式发布新一代大模型GLM-5。2月12日,摩尔线程称,基于SGLang推理框架,在旗舰级AI训推一体全功能GPU MTT S5000上,公司已完成了对GLM-5全流程适配与验证。
摩尔线程方面介绍,凭借MUSA架构广泛的算子覆盖与强大的生态兼容能力,公司成功打通了模型推理全链路,并深度释放MTT S5000的原生FP8加速能力,在确保模型精度的同时显著降低了显存占用,实现了GLM-5的高性能推理。相关负责人表示,此次快速适配,不仅印证了MUSA软件栈的成熟度,更充分展现了国产全功能GPU对最新大模型即时、高效的支持能力。
MTT S5000单卡算力最高达1000TFLOPS
摩尔线程首次披露了MTT S5000的具体参数。据摩尔线程官网介绍,MTT S5000采用自研第四代MUSA架构“平湖”,专为大规模AI训练优化,是摩尔线程推出的AI旗舰级全功能GPU,其单卡AI算力最高可达1000TFLOPS,配置80GB显存,显存带宽1.6TB/s,片间互联带宽达到784GB/s,可广泛应用于大模型训练、推理及高性能计算。依托原生FP8硬件加速,模型训练性能提升超30%。
2025年业绩预告显示,摩尔线程预计2025年全年实现营业收入14.5亿元至15.2亿元,同比增长230.70%至246.67%;预计归母净亏损9.5亿元至10.6亿元,亏损幅度收窄为34.50%至41.30%,同比减亏明显。
摩尔线程在公告中表示,公司推出的旗舰级训推一体全功能GPU智算卡MTT S5000,其性能达到市场领先水平,并已实现规模量产。基于该产品构建的大规模集群已完成建设并上线服务,可高效支持万亿参数大模型训练,其计算效率达到同等规模国外同代系GPU集群的先进水平。
据接近摩尔线程人士透露,MTT S5000单卡算力可达1000TFLOPS,实测性能对标英伟达H100,在产品精度上已超越H100,接近Blackwell架构。在智源RoboBrain2.5及千亿参数模型训练中,该卡与H100结果高度重合,关键指标误差仅在千分之几。此外,该卡联合硅基流动完成了DeepSeek-V3满血版适配,其单卡Prefill吞吐量突破4000tokens/s,Decode吞吐量达1000tokens/s,刷新了国产GPU推理纪录。
MTT S5000已适配自动驾驶、具身智能等训练场景
2月6日,摩尔线程公司与小马智行正式宣布达成战略合作。据介绍,双方将聚焦L4级自动驾驶技术落地与规模化应用,围绕小马智行技术核心——世界模型及虚拟司机系统的训练与优化展开深度协同,共同探索“AI算法+AI算力”深度融合的合作新范式,以安全可靠的AI算力,赋能自动驾驶技术迭代和商业落地。
摩尔方面介绍,双方将基于摩尔线程MTT S5000训推一体智算卡及夸娥智算集群,共同推进小马智行世界模型及车端模型训练的适配与验证,并通过合力构建产业生态,持续推动中国自动驾驶在“算法-数据-算力-应用”全链路协同,加速L4级技术成熟与成本优化,为智慧出行与物流领域的高质量发展提供坚实支撑。
目前,基于S5000的万卡集群已规模化部署并上线服务。据介绍,该产品已联合智源研究院、硅基流动等伙伴,在千亿参数模型实战中表现优异:训练精度与H100高度重合;依托原生FP8硬件加速,其模型训练性能提升超30%。
1月13日,摩尔线程宣布,公司近日联合北京智源人工智能研究院基于FlagOS-Robo框架,依托MTT S5000千卡智算集群,成功完成智源自研具身大脑模型RoboBrain2.5的全流程训练。
摩尔线程介绍,这是行业内首次验证国产算力集群在具身智能大模型训练中的可用性与高效性,标志着国产AI基础设施在应对复杂多模态任务上迈出了关键一步。通过面向多元芯片的统一AI系统软件栈FlagOS与MTT S5000硬件集群的高效协作,该解决方案不仅“能训”,而且实现了“训得稳、训得快”,为具身智能从实验室走向产业落地提供了坚实底座。
热门跟贴