2026年,AI正进入一个新的拐点——从“研究”迈向“落地应用”。如果说前几年AI产业更多停留在实验室,不断堆参数,从百亿到千亿再到万亿;那么近几年,AI大模型已经走出实验室,完成了从“技术原型”到“产业落地”的转变,逐渐进入规模化落地的关键阶段。今年OpenClaw、Hermes Agent接连爆火,让AI不再只是会聊天的工具,而是能干活的“数字员工”,真正走进千家万户。

然而,拐点也意味着瓶颈暴露。当Agent从尝鲜走向常态的这个重要节点,有三个新的时代问题需要回答:

第一问,如何突破算力架构,应对Agentic AI带来的全域负载?
第二问,如何重构算力协同,应对算力需求的结构性变化?
第三问,如何让智能体规模化落地,进一步加速AI应用落地?

在刚刚召开的鲲鹏昇腾开发者大会2026上,鲲鹏超节点方案针对这些问题给出了回答。

01 CPU走到舞台中央,算力格局重构 鲲鹏超节点第一件事是“修桥铺路”

2026年,AI智能体掀起了AI应用的第二波浪潮——toB之后,toC迎来爆发。

这种变化就在身边:工作中查资料、做竞品分析、写深度报告,交给Agent;生活中在电商购物,AI导购不光推荐商品,还会主动问消费习惯,帮你凑单省钱,提醒注意事项。从聊天到干活,从尝鲜到离不开,用户的依赖在加深,算力的压力也在成倍放大。

业内预计,到2028年AI智能体总算力需求将达到2025年的12倍以上。

面对这个压力,多数人的第一反应是加机器。但问题不在于服务器不够多,而在于服务器之间有"墙"。

传统架构下,每台服务器各自守着自己的内存,CPU和XPU之间传数据得先打包、拷贝、传话,折腾好几个来回。机器越多,墙越多,数据在墙与墙之间搬来搬去,效率不升反降。你以为加了一百台机器就多了一百倍算力,实际上大量时间花在了搬数据上。

除了有“墙”,Agentic AI时代,压力还体现在结构方面,过去训练推理阶段,CPU更多是配角,算力占比不到10%。而随着Agent应用的爆发,CPU走到了舞台中间,Agent每执行一个任务,工具调用、结果验证、分支调度、回调处理……这些重活都在CPU上,算力占比已提升到40%以上,成为AI集群容量规划的独立约束。

但是,当前CPU和XPU的协作仍然不够完善,缺乏系统级统一调度。这就好比一个团队,有人忙到加班有人闲到刷手机,不是人不够,是工作分配出了问题。

这两个问题指向同一个答案:算力架构需要一场从"堆叠"到"融合"的变革。而鲲鹏超节点,正是为这场变革而来。

鲲鹏超节点做的第一件事,是拆墙。全局内存统一编址,就是那把拆墙的锤子。它让CPU和NPU共享同一套地址空间,数据不用"搬"了,直接"取",就像从各自锁柜子变成了共享大仓库,抬手就能拿到。算力集群真正从"服务器堆叠"变成"一台超级计算机"。

第二件事,是修路。光拆墙还不够,路也得宽。灵衢互联把带宽提升10倍、时延压到百纳秒级,让数据在"仓库"之间跑起来不再堵。

第三件事,是把协同从"同步"升级为"同频"。同步模式是"你等我我等你,对齐才能往下走";同频模式是"大家踩着同一个点走,一步接一步不停歇"。在鲲鹏超节点中,CPU和XPU在等待对方时,可以先去处理别的任务,提升协同效率。

第四件事,是通过异构融合OS,实现算力资源的灵活调配,进一步提升整体利用率。

四件事合在一起,让CPU和XPU真正从"各干各的"变成"一个整体"。算力不再被墙隔开,协同不再互相等待——这才是Agentic AI时代该有的算力底座。

02 攻克Agent的"记不住、管不住、跑不开" 让智能体真正规模化落地

今年,AI智能体所展现出的强大应用价值和潜力已经是业内共识,也被视为开启一个AI新时代的技术,众多科技企业都在这一领域投入。数据显示,截至2025年底,GitHub上星标过百的开源AI智能体项目超过1500个,相比2023年增长超10倍,毫无疑问,2026年这一数据还将获得大幅增长。

但Agent要真正落地企业,有三个问题必须解决:记不住、管不住、跑不开。

第一个问题:记不住。

沟通完后面忘了前面,又要重新返工,Token烧了又烧。是模型不够聪明吗?是记忆系统不够用了。问题的根源在于,记忆没有被统一管理,而是散落在各个角落。

鲲鹏的解法,是让记忆系统从“各管各的”变成“统一管理” 。

硬件侧,鲲鹏基于超节点架构,打造单节点TB级内存池,先把记忆系统的“池子”变大,然后构建片上内存/DDR/SSD多级缓存体系:片上内存负责"热数据层",就像手边的资料,随用随取;DDR和SSD负责"温层/溢出层",就像书架和仓库,暂时不用的记忆存进去,需要时快速调取。软件侧,鲲鹏构建的语义感知KV Cache调度的记忆系统,不是把所有信息一股脑丢进系统,而是精准理解每条记忆的语义和重要程度,通过对话预压缩、记忆全生命周期管理、KV Cache池化调度等方式,按需调取。就像给所有档案做了智能分区,想找谁清清楚楚。

第二个问题:管不住。

Agent越能干,权限越高,越需要划清边界。当Agent代为执行用户任务时,数据越权访问、权限边界模糊、操作不可追溯的风险一直存在。Agent进企业的最后一公里,更多的是信任问题——智能体必须做到可控、可知、可恢复。

鲲鹏的解法分三层。一是可信授权,限定容器进程只能访问预定义资源,防止恶意进程破坏宿主机。二是安全隔离,基于CCA机密计算架构,Agent独占系统内存,有效抵御memory dump攻击,保护敏感信息。三是数据加密与秒级回滚:结合鲲鹏自研内生密码模块和openGauss的闪回技术,实现重要数据加密存储和数据秒级恢复。三个安全目标落到实处:不会乱执行违规操作、敏感数据不会被偷走、出故障能立刻恢复。

第三个问题:跑不开。

Agent想大规模跑起来,不是给一台机器就行的——每个Agent都需要独立的运行环境,要拉得起、回得来、密度还得高。传统方案下,要么启动慢、要么占资源多,跑几十个Agent就把机器撑满了,根本谈不上规模化。

鲲鹏超节点沙箱方案,就是让Agent"跑得开"。第一是“快”,通过依托多级缓存共享架构,以及快照资源共享,还有remote-fork能力,可以快速拉起1000沙箱。第二是“多”,通过构建三级内存的流动能力与CPU分时复用技术,可以实现超高密度的部署,具备单机部署超过两千个沙箱的能力。第三是“稳”,通过构建的增量快照共享与任意状态快速fork能力,实现十毫秒级别的快速回滚,生态上支持高效Agent Scaling,支撑任务成功率提升10%。

回到开头的问题,鲲鹏的回答其实指向同一件事:AI的瓶颈,从来不在模型本身,而在模型脚下的路够不够宽、够不够稳。算力架构、CPU和XPU协同、Agent可信,这些事情不是独立问题,而是同一条链上的环节,任何一环掉链子,Agent就出不了实验室。

而鲲鹏超节点做的,是把这条链从"能跑"拉到"跑得快、跑得稳、跑得让人放心"。当算力不再是瓶颈,协同不再是空转,Agent不再是黑箱,AI才能真正从“盆景”变成“森林”。鲲鹏超节点所夯实的基础设施,正是这片森林得以生长的沃土,旨在助力中国AI应用实现从“领先一步”到“领先一路”的跨越。