摩尔线程描绘了更大的蓝图：从全功能GPU到Agent全场景落地|agent|gpu|大模型|张建中|摩尔线程|算子

算力荒的焦虑已无需渲染。

5月的一个北京夜晚，创始人、董事长兼首席执行官张建中在摩尔线程2026年产品发布会现场透露一组数据：当前国内每天仅某一款应用的Token消耗量就已突破140万亿——而此前的预测，是整个市场总消耗量在30万亿到180万亿之间。

为抗住这源源不断的算力需求，一个可靠的人工智能基础设施必不可少。但算力只是故事的一半。“场景最后还是要通过笔记本、手机或者其他终端来实现。”一位投资人告诉雷峰网。

从云端到终端，从算力到生态——这场发布会上，摩尔线程展示了一张完整的版图。

从“小麦”到具身智能，摩尔线程补齐物理AI版图

试问token消耗的第一来源，自然是当下备受关注的AI Agent。

IDC预测，到2030年全球活跃AI智能体将达22.16亿。中国企业AI智能体数量将在2031年突破3.5亿规模，年复合增长率达到135%以上。

国内的热情更是传导至政策端。2026年政府工作报告首次把“智能体”三个字写了进去——2027年普及率目标超70%，2030年超90%。

但不可忽视的是，当前市面上不少智能体在主动服务、长期记忆等能力上仍有短板，而摩尔线程本次首发的全域智能体“小麦”，可谓恰逢其时。

比OpenClaw的分数高出20%左右、综合评分远超其他国产同类型产品——摩尔线程推动建立的可视化测评系统MTClaw Evaluation System给到了多维度的评估，张建中重点介绍了其中三个特性：

“事办得全”——在7×24小时服务里，“小麦”基于原生Linux环境支持超36种APP的控制，具备60多种复杂skill，可无缝衔接90个以上CLI工具。

“事办得好”——借由二维拓扑记忆系统，小麦在融合短时和长时记忆的基础上不断归纳总结习得的知识。

“事办得快”——基于摩尔线程自研架构MTClaw，小麦在调用高频工具时，成功率已超过95%，端到端任务执行效率相比使用框架前提升了7倍。

“我们希望‘小麦’迅速落地到千家万户。”张建中直言。

于是，摩尔线程首款面向家庭的消费级产品——MTT AICUBE，成了小麦的第一个“家”。在现场，张建中用“三位一体”——AI Agent、AI PC、AI NAS——来定义这块迷你智能立方体。

支撑这款家庭AI中枢的算力底座，其实在去年摩尔线程首届MUSA开发者大会上早有预告。内置CPU、GPU、NPU和VPU，摩尔线程首颗自研智能SoC芯片“长江”实现了50TOPS异构算力，内存可达32GB。

而用户对超群记忆力、数据不上云的安全需求则有赖于标配的1TB全闪SSD以及12TB的可扩展空间。

以家庭照片和视频为例，AICUBE可自动整理相册、生成纪念视频、实时视频超分，满足家庭“存得下、找得到、用得起来”的需求。

如果说AICUBE把“小麦”留在了家里，那么MTT AIBOOK则把它装进了背包。直面当下OPC（个人公司）风口，这款此前同样官宣过的AI PC，能在本地能同时跑12个以上智能体，直连90多款工具，协同完成全链路工作。

稳定运行背后，是摩尔线程打造的原生AI操作系统在做支撑——相对Windows更轻量、更实时、更可靠。

雷峰网注意到，开箱即用是MTT AIBOOK的另一大亮点。出厂预装OpenClaw的同时，也为用户准备了可一键切换的MTClaw。此外，内置的PES应用市场方便用户随时下载新应用；提供的Windows虚拟机和安卓预置容器，让用户可以在不同系统环境中无缝运行各类软件。

为了免除消费者的后顾之忧，摩尔线程还联合趋境科技，为每位AIBOOK用户提供7×24小时远程技术支持。

从AICUBE到AIBOOK，“小麦”学会了处理数字事务。但张建中想更进一步——让智能体走进物理世界，真正动手干活。

他指出，训练一个能在物理世界中自主行动的智能体，面临真实数据稀缺且采集成本高、真机训练风险大和场景难以泛化的挑战。要解决这些问题，不能靠真机硬摔，而需要一个高保真的仿真环境。

MT Lambda由此而生。作为国内首个全栈国产化具身智能仿真平台，它硬件上依托支持光线追踪的S5000 GPU和夸娥集群，软件上融合开源MujoCo、Newton及自研AlphaCore引擎，最终实现多物理场的统一求解与更快更逼真的渲染速度。现场机器狗灵活的一举一动，便是最直观的注脚。

据张建中介绍，当前摩尔线程已经联合光轮智能、智源研究院和光线云等合作伙伴，打通从数据合成到模型训练再到策略部署的闭环。同时，他也呼吁更多同行者加入其产业生态圈“PES联盟”，共同推进具身智能仿真与训练。

夸娥万卡集群与MUSA生态，支撑算力爆发的洪流

支撑智能体和仿真平台的，正是摩尔线程的云端底座——在S5000基础上搭建的夸娥万卡集群。而它的核心考验同样在于够不够稳定和高效。

以大模型训练需求为例，张建中指出，客户不愿换用国产智算集群，根源并非软件或兼容问题，而是集群能不能“7×24小时不停机”。

摩尔线程用具体测评数据给出了答案：有效训练时长占比超过90%，稠密模型MFU超40%，MoE模型MFU超60%。

交出可靠答卷的同时，摩尔线程还啃下“精度”和“扩展稳定性”这两块硬骨头，确保每一个训练步骤跟国际主流产品保持精度对齐，在万卡规模下保持95%左右的线性扩展率。

预训练只是第一步。后训练，尤其是强化学习阶段，模型需要反复生成回答、接收反馈、迭代更新，对推理吞吐量和稳定性的要求极高。

为此，摩尔线程在训练框架中集成了SGLang和vLLM两大开源推理引擎，保障数据的高效生成。在此基础上，摩尔线程还尝试使用训推分离Slime方案和训推一体VeRL方案，两者的提升效果均肉眼可见。

转向需求更火爆的推理场景，夸娥集群的“强悍”在AI漫剧和短剧创作上体现得淋漓尽致。张建中直言，“以前只有好莱坞导演花大价钱才能制作的大片，现在短时间就能生成。”

这背后依托的，正是摩尔线程在夸娥集群上部署的全流程智能生产流水线——涵盖文生视频、语言理解、剧本创作等模型，配合自研语音生成引擎“摩语精灵”，能够精准复刻或转换声音。

无论是训练还是推理性能的充分发挥，都需要软件栈做支撑，而这恰恰是摩尔线程近年来持续加码的方向。目前，MUSA已完整支持700多个核心API，驱动与运行时全部免费开放。

算子层面，摩尔线程的核心数据库实现100%兼容，55类算子覆盖所有核心AI算子，MuDNN性能与原生态基本持平；PyTorch算子层做到100%兼容，SDK升级至5.1版本；针对大语言模型最常用的FlashAttention，摩尔线程将其算子效率优化至95%，大幅缩短了Transformer和MoE用户的适配时间。

聚焦国内算子开发社区，摩尔线程一方面将国产AI编程语言TileLang集成至开源主线，GEMM算子效率超95%，Attention效率超90%；另一方面还与智源研究院合作，推进基于Triton的算子开发。

值得注意的还有摩尔线程的AI编程神器MUSACODE。张建中表示，开发者无需学习MUSA代码，直接用自然语言就能与其交互，或通过与“小麦”的对话生成MUSA Kernel或算子。据张建中透露，MUSACODE已原生集成在AIBOOK的VSCode中。

此外，MUSA还新增了对编译器Fortran的支持，便于传统代码的迁移。

夜色渐深，发布会结束后的展区里，有人对着“小麦”说话，有人翻看MUSA教学书籍，有人围观多智能体协同演示……人潮久久未散。

算力焦虑还在，但国产的答案，一年比一年具体了。