2月12日,智谱正式发布新一代大模型 GLM-5。同日,摩尔线程宣布,其旗舰级AI训推一体GPU MTT S5000已基于 SGLang 推理框架,Day-0完成对 GLM-5的全流程适配与验证。

据介绍,依托第四代 MUSA 架构的广泛算子覆盖与生态兼容能力,摩尔线程已打通 GLM-5模型推理全链路,并释放 MTT S5000原生 FP8加速能力。在确保模型精度的同时,显著降低显存占用,实现高性能推理表现。此次同步适配也被视为国产全功能 GPU 对最新大模型实现“即时支持”的重要案例。

硬件层面,MTT S5000面向大模型训练与推理场景设计,单卡 AI 算力最高可达1000 TFLOPS,配备80GB 显存,显存带宽1.6TB/s,卡间互联带宽784GB/s,完整支持 FP8至 FP64全精度计算。基于 MUSA 全栈平台,该卡原生兼容 PyTorch、Megatron-LM、vLLM、SGLang 等主流框架,支持万卡级训练集群与高并发在线推理部署。

摩尔线程表示,从GLM-4.6、GLM-4.7到GLM-5,摩尔线程已将“发布即适配”化为常态,这种对主流软件栈的无缝兼容与敏捷响应,充分证明了国产全功能GPU及MUSA软件栈的成熟度与稳定性,确保开发者能第一时间触达最新模型能力,从而携手共建蓬勃发展的国产AI生态。(袁宁)