Token时代的云服务，应该是怎样的？|云服务|全栈|应用层|智能云|智能体

历史总是有着相似的韵脚。

一个多世纪前，汽车工业开始席卷世界，马路上开始有了疾驰的新工具。这个集成度空前的终端产品，对高速旋转的稳定性、金属材料的疲劳强度、零部件的标准化模组提出了近乎苛刻的要求。它像一头机械巨兽，倒逼整个工业体系从粗加工时代踉跄闯入精细模组化时代。发动机、轮胎、钢铁、电气系统，开始被一个精密的系统逻辑粘合在一起。

百年后，相似的故事在数字世界重演。这一次，站在舞台中央的终端产品，叫做Agent（智能体）。随着AI的重心从单纯的技术突破转向深度应用落地，万千行业都开始期待有能自主决策、拆解复杂任务的数字员工，一场针对底层供给侧的深刻重塑箭在弦上。

这正是百度智能云提出“新全栈”概念的时代背景。5月13日，在Create2026百度AI开发者大会上，百度创始人李彦宏首次提出AI时代的“度量衡”——日活智能体数（DAA），他认为衡量平台和生态的繁荣，不只要看DAU，更要看有多少Agent真正替人类工作并交付结果。

在这一判断下，百度集团执行副总裁、百度智能云事业群总裁沈抖宣布，百度智能云将全面升级为面向大规模智能体应用的新全栈AI云。

（百度集团执行副总裁、百度智能云事业群总裁沈抖）

按照大会披露的信息，百度智能云围绕AI Infra、Agent Infra与AI Agent三大方向，首次亮相30余项新能力，意在把底层算力、模型推理、工具调用到智能体应用落地的链路进一步打通。

百度智能云希望打造的是单位Token智能水平更好的Agent Infra，以及每瓦性能更强、性价比更高的AI Infra。换句话说，云服务正在从“供给算力”转向“供给可规模化运行的智能”。

这是一次对AI云服务逻辑的重构，百度智能云正在试图回答一个核心问题：当需求侧从调用计算资源，变为驾驭一种流动的、进化的智能时，供给侧应该交出怎样的答卷？

当AI开始落地，云服务悄悄换了底牌

要理解新全栈，首先要看清需求的剧变。

过去很长一段时间，企业上云，采购的是一个清晰的功能清单：算力是IaaS，平台是PaaS，软件是SaaS。这像是一套精密的拼图，客户需要自己成为那个熟悉每一块组件、懂得如何将其拼装成型的工程师。彼时云厂商所谓的全栈能力，比拼的核心在于品类是否齐全，更像是能力模块的集合。

然而，随着以智能体为核心的新形态AI产品涌现，这套逻辑开始松动。

新需求截然不同。

客户不再满足于简单的接口调用或静态的模型问答。他们需要的是一个能在真实业务场景中落地的智能体。它必须具备长短期记忆能力，能像人类专家一样记住上下文、积累经验；它需要强大的任务规划与拆解能力，将一个模糊的指令分解为几十甚至上百步的可执行动作；它还需要自主决策能力，在复杂多变的环境中做出精准判断，调用合适的工具。

这种需求的本质，是要求AI从一个被动的工具，变成一个主动的协作者，甚至是一个能独立承担职能的数字员工。比如在义乌“前店后厂”的模式中，我们看到了这种需求的生动体现，比如一位“AI厂长”需要基于视觉智能体，独立完成从现场感知、质量问题判断到干预和汇报的全流程；“AI店长”则需要同时处理多语种导购、销售数据分析、库存预警和物流优化，相关的角色需要完成对完整业务的系统性接管。

这种从工具驱动到AI驱动的跨越，带来了一个根本性变化：开发者心态的迁移。他们不再将AI视为一种固化的计算资源，而是将其视为一种流动的资源。同理，支撑智能体运行的底层架构，也必须能够根据应用层瞬息万变的任务形态，实时调配从芯片到模型的一切资源。

终端产品的复杂性，开始以前所未有的力度，倒逼底层供应链的整体进化。云服务本身，也在被这样的需求倒逼进化。

新全栈的内核，是打破孤岛，构建协同系统

面对新需求的倒逼，传统的全栈叙事已然失效。

在过去，即便是行业头部的AI云厂商，其全栈能力也往往呈现出一种分层割据的状态。芯片研发、云底座建设、模型训练平台、应用开发框架，每一层都有明确的边界，像是独立的能力。

这种架构在需求简单、任务链路短的时候并无大碍。一个典型的API调用场景中，用户请求进入应用层、模型完成推理、返回结果，链路清晰，各层之间不需要频繁交互。

但当需求变成一个智能体要在十几轮甚至几十轮对话中持续调用内外工具、维护长上下文、拆解复杂子任务时，情况就完全不同了。每一次推理都可能涉及计算资源的重新调度、缓存的即时复用、下游工具的异步响应。如果各层之间仍然通过相对固化的接口来沟通，无论是响应时延还是资源效率，都会成为显性瓶颈。

更通俗易懂的来说，传统全栈能力很难支撑智能体的大规模、长链路、高并发运行任务。

如果说过去云厂商比拼的是资源规模和品类齐全，那么今天，深水区的竞争是关于系统性整合能力的较量。

这正是百度智能云提出新全栈的核心意图。百度智能云所尝试的，是打破孤岛，将整个技术栈从一块拼图重塑为一个能够全局协同、自我进化的有机体。

在《奇点湃》看来，这个系统性调整，主要体现在三个层面：

第一、芯片与模型的联动。在新全栈的逻辑里，底层芯片不再是提供通用算力的标准化元件。它为模型而生，因模型而变。会上披露，昆仑芯P800已完成规模化验证，2025年至今已交付多个万卡集群；在昆仑芯全国产集群上，百度已完成文心5.1重要版本训练，整个集群有效训练率达到97%，万卡规模集群线性扩展度超过85%。

算力的分配不再是粗放的灌溉，而是精准的滴灌，确保每一瓦特电力、每一次计算周期，都能转化为最大化的智能产出。

算力硬件之外，百度智能云也把AI Infra进一步产品化：百度百舸6.0 AI计算平台正式发布；全模态训练框架LoongForge已对外开源，训练效率领先社区1倍；面向Agentic模型的强化学习框架训练效率提升1倍；高效推理系统vLLM-Kunlun则用于加速新模型在昆仑芯上的落地。

（图注：百度集团副总裁侯震宇现场演讲）

第二、IaaS、PaaS与SaaS的协同。这是新全栈最具颠覆性的设计，当一个智能体在应用层（SaaS）遭遇高并发压力或需要执行超长链路任务时，这种压力不再需要人工报警和手动扩容，而是像生物的神经反射一样，瞬间被平台层（PaaS）感知。平台层随即进行模型调度优化，并同步触发基础设施层（IaaS）的计算、网络和存储资源进行自动化弹性伸缩，整个技术栈具备了敏锐响应能力。

这种设计让技术栈在面对智能体这种高度动态的负载时，不再依靠人的经验来预估和兜底，而是自身具备了对外部变化的响应能力。

第三，供给形态的变化。正是有了前两者的纵向打穿，新全栈才能将芯片、云、模型、智能体，通过云服务这个基座粘合为一个整体。客户可以调用的，不再是某一层能力，而是一整套从底层算力到顶层应用的、无缝集成的新供给。

这种新供给也在应用层被具体化。会上，通用智能体百度搭子DuMate移动端App亮相，强化长程任务执行与主动决策能力；百度伐谋升级2.0，并在生产排程、物流规划、工艺优化场景强化垂直能力；代码智能体秒哒升级3.0并上线App及企业版；由本体驱动的业务数据智能平台百度胜算，则试图让Agent理解数据、场景与业务。

这就是新全栈的进化论：从割裂走向融合，从工具的组合走向系统的智能。

让多个业务场景，都具备进化的能力

新全栈能力的建构，不只在于技术方面的革新，更而在于它能以更高的效率、更低的门槛，去适配各种业务场景的复杂需求。

在工业制造领域，义乌的前店后厂模式正在被AI重新组织。这座被称为世界超市的城市，孕育了一种独特的生产组织方式：前端门店承接全球订单，后端工厂快速响应生产，信息需要在市场与产线之间高速流转。

过去，一位厂长要管理安全、质量、物料，需要针对每类问题单独训练模型，再将识别规则逐一配置到每个摄像头上。如今，基于百度一见视觉智能体打造的AI厂长，可以独立完成从现场感知、违规判断到干预处置和结果上报的全流程。它不再是某个摄像头的规则集合，而是一个能综合管理安全、质量、工序、物料和服务的数字中枢。

与AI厂长并肩上岗的，还有基于百度智能云Hogee搭建的AI店长。很多小型店铺只有一两个人，既要盯生产，又要管经营。AI店长内置了一系列营销技能，不仅能做多语种导购，还能帮商家分析销售数据，结合库存给出调货建议，发现逾期订单提前预警。当物流信息接入后，它还能计算物流成本和交付时效，帮商家更精细地做经营决策。

新全栈将视觉、语言、数据分析这些复杂能力封装为开箱即用的专家级数字员工，让最传统的生产经营单元也获得了持续进化的抓手。

在能源领域，国家电网是一个新全栈如何落地运作的典型切面。百度智能云与国网的合作从2016年起步，最初是智能客服，提升用电咨询的响应效率。2024年，双方共同打造的千亿级光明电力大模型上线，AI开始走进电网的核心系统。到今天，智能体已在四十余个场景中落地。

电力巡检是一个代表性场景。传统方式下，视觉小模型在现场做缺陷识别，但准确率往往只有五六成，误报多、泛化能力弱，一线工人需要从大量无效告警中人工筛查真实缺陷，耗时费力。

新全栈的联动机制在这里发挥了关键作用：视觉小模型部署在前端进行实时初判，当遇到罕见缺陷或模糊图像，数据实时上传至云端，由千亿级光明电力大模型进行精准复判。小模型负责速度，大模型负责精度，两者通过端边云的协同分工，将缺陷识别准确率提升至百分之八十以上，巡视时间从两个半小时压缩到四十五分钟。

这套方案已覆盖全国八百多座变电站。其背后，是端侧芯片的推理加速、边缘模型的轻量化部署、云端巨量算力的弹性供给，三者通过新全栈的逻辑无缝联动，守护着十一亿人的供电安全。

在具身智能这个前沿战场，挑战更加复合。企业需要同时驾驭数据、模型、本体三座大山，百度智能云将十年自动驾驶积累的数据服务能力迁移过来，用百舸平台的全模态训练加速超过70%，帮助企业构建物理世界AI的规模化迭代能力。

会上披露，北京人形机器人创新中心正借助百度百舸AI计算平台构建具身智能软硬件全栈能力，并围绕通用机器人平台“天工”、通用具身智能平台“慧思开物”推进应用示范。在其模型开发过程中，百舸平台通过自动弹性容错机制保障千卡规模集群稳定运行，助力客户有效训练时长占比达到99.5%；面向具身智能场景的研发工具链，也覆盖数据、开发训练、强化学习与推理等环节。

这些场景千差万别，但它们共享同一套底层基础设施。在AI Infra层面，面向智能体的推理系统优化，通过KV Cache的分层池化，将命中率做到90%以上，极大减少了长链路任务中的重复计算；Agentic强化学习性能优化方案，则让模型在强化学习阶段就注入了高效处理复杂、长程任务的基因。在更底层的吉瓦级AIDC，网络向心布局、风液兼容架构等设计，将每一瓦电力用到极致，确保算力能像水电一样，实现更快的部署和灵活的供给。

从金融风控到智能座舱，从应急管理到居家养老，百度智能云已在超百个场景中落地了智能体。这些场景千差万别，但其底层都贯穿着同一种能力，由新全栈所交付的，系统性的、能够自我进化的生产力。