算力荒的焦虑已无需渲染。
5月的一个北京夜晚,创始人、董事长兼首席执行官张建中在摩尔线程2026年产品发布会现场透露一组数据:当前国内每天仅某一款应用的Token消耗量就已突破140万亿——而此前的预测,是整个市场总消耗量在30万亿到180万亿之间。
为抗住这源源不断的算力需求,一个可靠的人工智能基础设施必不可少。但算力只是故事的一半。“场景最后还是要通过笔记本、手机或者其他终端来实现。”一位投资人告诉雷峰网。
从云端到终端,从算力到生态——这场发布会上,摩尔线程展示了一张完整的版图。
从“小麦”到具身智能,摩尔线程补齐物理AI版图
试问token消耗的第一来源,自然是当下备受关注的AI Agent。
IDC预测,到2030年全球活跃AI智能体将达22.16亿。中国企业AI智能体数量将在2031年突破3.5亿规模,年复合增长率达到135%以上。
国内的热情更是传导至政策端。2026年政府工作报告首次把“智能体”三个字写了进去——2027年普及率目标超70%,2030年超90%。
但不可忽视的是,当前市面上不少智能体在主动服务、长期记忆等能力上仍有短板,而摩尔线程本次首发的全域智能体“小麦”,可谓恰逢其时。
比OpenClaw的分数高出20%左右、综合评分远超其他国产同类型产品——摩尔线程推动建立的可视化测评系统MTClaw Evaluation System给到了多维度的评估,张建中重点介绍了其中三个特性:
“事办得全”——在7×24小时服务里,“小麦”基于原生Linux环境支持超36种APP的控制,具备60多种复杂skill,可无缝衔接90个以上CLI工具。
“事办得好”——借由二维拓扑记忆系统,小麦在融合短时和长时记忆的基础上不断归纳总结习得的知识。
“事办得快”——基于摩尔线程自研架构MTClaw,小麦在调用高频工具时,成功率已超过95%,端到端任务执行效率相比使用框架前提升了7倍。
“我们希望‘小麦’迅速落地到千家万户。”张建中直言。
于是,摩尔线程首款面向家庭的消费级产品——MTT AICUBE,成了小麦的第一个“家”。在现场,张建中用“三位一体”——AI Agent、AI PC、AI NAS——来定义这块迷你智能立方体。
支撑这款家庭AI中枢的算力底座,其实在去年摩尔线程首届MUSA开发者大会上早有预告。内置CPU、GPU、NPU和VPU,摩尔线程首颗自研智能SoC芯片“长江”实现了50TOPS异构算力,内存可达32GB。
而用户对超群记忆力、数据不上云的安全需求则有赖于标配的1TB全闪SSD以及12TB的可扩展空间。
以家庭照片和视频为例,AICUBE可自动整理相册、生成纪念视频、实时视频超分,满足家庭“存得下、找得到、用得起来”的需求。
如果说AICUBE把“小麦”留在了家里,那么MTT AIBOOK则把它装进了背包。直面当下OPC(个人公司)风口,这款此前同样官宣过的AI PC,能在本地能同时跑12个以上智能体,直连90多款工具,协同完成全链路工作。
稳定运行背后,是摩尔线程打造的原生AI操作系统在做支撑——相对Windows更轻量、更实时、更可靠。
雷峰网注意到,开箱即用是MTT AIBOOK的另一大亮点。出厂预装OpenClaw的同时,也为用户准备了可一键切换的MTClaw。此外,内置的PES应用市场方便用户随时下载新应用;提供的Windows虚拟机和安卓预置容器,让用户可以在不同系统环境中无缝运行各类软件。
为了免除消费者的后顾之忧,摩尔线程还联合趋境科技,为每位AIBOOK用户提供7×24小时远程技术支持。
从AICUBE到AIBOOK,“小麦”学会了处理数字事务。但张建中想更进一步——让智能体走进物理世界,真正动手干活。
他指出,训练一个能在物理世界中自主行动的智能体,面临真实数据稀缺且采集成本高、真机训练风险大和场景难以泛化的挑战。要解决这些问题,不能靠真机硬摔,而需要一个高保真的仿真环境。
MT Lambda由此而生。作为国内首个全栈国产化具身智能仿真平台,它硬件上依托支持光线追踪的S5000 GPU和夸娥集群,软件上融合开源MujoCo、Newton及自研AlphaCore引擎,最终实现多物理场的统一求解与更快更逼真的渲染速度。现场机器狗灵活的一举一动,便是最直观的注脚。
据张建中介绍,当前摩尔线程已经联合光轮智能、智源研究院和光线云等合作伙伴,打通从数据合成到模型训练再到策略部署的闭环。同时,他也呼吁更多同行者加入其产业生态圈“PES联盟”,共同推进具身智能仿真与训练。
夸娥万卡集群与MUSA生态,支撑算力爆发的洪流
支撑智能体和仿真平台的,正是摩尔线程的云端底座——在S5000基础上搭建的夸娥万卡集群。而它的核心考验同样在于够不够稳定和高效。
以大模型训练需求为例,张建中指出,客户不愿换用国产智算集群,根源并非软件或兼容问题,而是集群能不能“7×24小时不停机”。
摩尔线程用具体测评数据给出了答案:有效训练时长占比超过90%,稠密模型MFU超40%,MoE模型MFU超60%。
交出可靠答卷的同时,摩尔线程还啃下“精度”和“扩展稳定性”这两块硬骨头,确保每一个训练步骤跟国际主流产品保持精度对齐,在万卡规模下保持95%左右的线性扩展率。
预训练只是第一步。后训练,尤其是强化学习阶段,模型需要反复生成回答、接收反馈、迭代更新,对推理吞吐量和稳定性的要求极高。
为此,摩尔线程在训练框架中集成了SGLang和vLLM两大开源推理引擎,保障数据的高效生成。在此基础上,摩尔线程还尝试使用训推分离Slime方案和训推一体VeRL方案,两者的提升效果均肉眼可见。
转向需求更火爆的推理场景,夸娥集群的“强悍”在AI漫剧和短剧创作上体现得淋漓尽致。张建中直言,“以前只有好莱坞导演花大价钱才能制作的大片,现在短时间就能生成。”
这背后依托的,正是摩尔线程在夸娥集群上部署的全流程智能生产流水线——涵盖文生视频、语言理解、剧本创作等模型,配合自研语音生成引擎“摩语精灵”,能够精准复刻或转换声音。
无论是训练还是推理性能的充分发挥,都需要软件栈做支撑,而这恰恰是摩尔线程近年来持续加码的方向。目前,MUSA已完整支持700多个核心API,驱动与运行时全部免费开放。
算子层面,摩尔线程的核心数据库实现100%兼容,55类算子覆盖所有核心AI算子,MuDNN性能与原生态基本持平;PyTorch算子层做到100%兼容,SDK升级至5.1版本;针对大语言模型最常用的FlashAttention,摩尔线程将其算子效率优化至95%,大幅缩短了Transformer和MoE用户的适配时间。
聚焦国内算子开发社区,摩尔线程一方面将国产AI编程语言TileLang集成至开源主线,GEMM算子效率超95%,Attention效率超90%;另一方面还与智源研究院合作,推进基于Triton的算子开发。
值得注意的还有摩尔线程的AI编程神器MUSACODE。张建中表示,开发者无需学习MUSA代码,直接用自然语言就能与其交互,或通过与“小麦”的对话生成MUSA Kernel或算子。据张建中透露,MUSACODE已原生集成在AIBOOK的VSCode中。
此外,MUSA还新增了对编译器Fortran的支持,便于传统代码的迁移。
夜色渐深,发布会结束后的展区里,有人对着“小麦”说话,有人翻看MUSA教学书籍,有人围观多智能体协同演示……人潮久久未散。
算力焦虑还在,但国产的答案,一年比一年具体了。
热门跟贴