金磊 发自 凹非寺
量子位 | 公众号 QbitAI

有这么一组数据,是真真儿地戳到了用Agent这件事的爽点

来,展示:

  • 公司AI代码覆盖率超过70%;
  • 内部已经创建700多个不同类型、不同部门的Skills;
  • 连接400多个API端点;每天有100多个AI协同PR;累计跑完14万多个工作流;
  • 6个核心阶段成功率均超过99.7%;交付代码0个P0、P1缺陷。
  • 缺陷自动修复从两天压缩到10分钟……

打开网易新闻 查看精彩图片

△图片由AI生成

看完这些数字,想必大家脑海里已经是一堆Agent塞满一家公司的画面了,而且是井井有条的那种。

这家率先尝到Agent“甜蜜点”的公司是谁?

小鹏汽车。

为什么是它能做到?

因为小鹏用了“云计算一哥”——亚马逊云科技

打开网易新闻 查看精彩图片

更准确地说,小鹏基于亚马逊云科技的KiroAmazon BedrockAmazon EKS等服务,搭了一套企业内部AI编程与Agentic工作平台,名字叫灵犀

小鹏集团AI/Data Platform负责人何瑞邦,在亚马逊云科技中国峰会的现场讲了一个非常具体的问题:2024年,小鹏内部已经普遍使用各种AI开发工具,一些员工的个人效率确实上来了,但整个部门的效率没有明显变化。

原因也很真实,一个稍微复杂点的项目,AI工具只能一环一环写。写完代码,还要人工集成、联调测试、推CI/CD。

说得直白一点,就是代码写得更快了,链路没真正跑通。也正如亚马逊全球副总裁、亚马逊云科技亚太区联席总裁储瑞松所说的:

Agentic AI爆发的拐点已然来临。AI Agent正在从一个辅助性工具,变成真正参与生产和价值创造的数字劳动力。

所以小鹏后来意识到一句话:

效率,不等于效能。

打开网易新闻 查看精彩图片

这其实也是很多企业用AI Coding、用Agent时的共同处境。单点提效很快,整体系统很慢;个人体验很爽,组织收益不明显。

小鹏的特殊之处在于,它面对的还不是普通软件工程,而是更复杂的物理AI。

智能汽车、Robotaxi、人形机器人、飞行汽车……这些场景里,软件和硬件绑得很紧。代码写完之后,还要编译、台架验证、回归、上线,链路更长,容错率更低。

更关键的是,当AI生成代码的速度越来越快,人类review和治理的速度反而跟不上了。

这时候,小鹏选择把AI Coding从写代码工具,往前推进一步——

让Agent变成一支研发军团。

一支永不下班的研发军团

一支永不下班的研发军团

灵犀的架构,大致可以拆成五层。

最上面,是开发者入口,包括网页端、IDE插件和硬件开发插件。开发者从这里提出需求、管理任务、查看结果。

往下一层,是Agent协作层。小鹏用Kiro做内核,把汽车行业的开发规范沉淀成Skills,让一群Agent按规范协同作战。

再往下,是数据和知识层。研发数据、项目上下文、Agent执行过程中学到的知识,都沉淀到这里。

模型层,则由Amazon Bedrock提供大模型能力。

最底层是基础设施。小鹏用Amazon EKS承载智能体运行,需要多少算力,就弹性供给多少算力。

打开网易新闻 查看精彩图片

这套架构跑起来之后,结果就是开头我们提到的那组数字:AI代码覆盖率超过70%,700多个Skills,400多个API端点,14万多个工作流,0个P0、P1缺陷。

其中最有代表性的变化,发生在SRE环节。

过去,一个缺陷自动修复可能要两天。后来小鹏基于Amazon Bedrock,建立了四大SRE Agent和五维归因,缺陷自动修复被压缩到10分钟。同类型bug下一次还能秒级命中,整个过程无需真人介入。

这也是Agent进入企业生产环境后,一个很典型的变化:

它带来的不只是写得快,而是把需求、设计、编码、测试、部署、运维、治理这些环节连成闭环。

这和Kiro本身的定位也有关。

Kiro强调的是Spec驱动开发。也就是在真正生成代码之前,先把需求、设计、任务、测试都结构化,再让Agent基于经过验证的规范写代码。

这样做的目标很明确了,从源头上提升正确性,而不是让AI先猛写,再把一堆技术债丢给人类收拾。

所以,小鹏这个案例最有价值的地方,在于它把企业研发体系里的“上下文、规范、工具、模型、算力、治理”一起串了起来。

这才是Agent真正起作用的样子。

当然,来到亚马逊云科技峰会站台的,不止小鹏。

Kimi出海,也搭上了亚马逊云科技

Kimi今天的到来,也是有点看头。

如果说小鹏展示的是Agent如何进入企业研发链路,那么Kimi展示的是另一件事——

中国大模型公司如何借助亚马逊云科技的全球基础设施和AI技术,把模型能力带给全球企业客户。

月之暗面Kimi B端业务负责人黄振新在现场提到,Kimi的长期目标,是寻求将能源转化成智能的最优解

打开网易新闻 查看精彩图片

这个说法听起来很大,但落到模型能力上,其实对应三个非常具体的方向:

  • 模型要更聪明,能在有限数据和算力下学到更多东西;
  • 上下文要更长,能干更长时间的活,还能记住一开始要做什么;
  • 单个Agent有天花板,多Agent协作要能完成更复杂的任务。

围绕这些方向,Kimi在token效率、长上下文、注意力残差和推理优化上持续投入。

黄振新在现场提到,Kimi通过架构和训练方法提升token效率,让10T数据发挥出20T效果;在长上下文方向推进新的线性注意力架构;通过注意力残差提升效率;还通过工程优化提高cache命中率,降低API使用成本。

最近,Kimi发布了K2.7 Code,并推出High Speed版本,输出速度达到180 token/s。

但对一家模型公司来说,能力做强只是第一步。要服务全球企业客户,还要解决一整套更工程化的问题:推理要稳,部署要快,客户要能方便接入,平台要支持训练和部署,商业化也要有全球分发渠道。

这正是Kimi和亚马逊云科技合作的重点。

打开网易新闻 查看精彩图片

基础设施层面,Kimi在亚马逊云科技遍布全球的数据中心和网络基础设施上获得算力支持,让模型推理服务跑得更快、更稳。

平台服务层面,Kimi与Amazon SageMaker集成,支持客户在SageMaker上完成模型训练和部署,降低开发者使用门槛。

模型服务层面,Kimi接下来也会接入Amazon Bedrock,成为亚马逊云科技原生AI能力的一部分。

应用层面,Kimi已经在Marketplace上完成上架,全球客户可以一键使用、按量付费。同时,Kimi也通过APN合作伙伴网络拓展企业客户,并与亚马逊云科技联合打造行业解决方案,未来覆盖金融、医疗、制造等场景。

这条路径非常典型。

模型公司负责把智能做强,云厂商负责把算力、平台、分发、生态、合规和全球交付能力补齐。两者叠加,模型才有机会从一个API,变成企业能放心采购和使用的一项生产力。

猎豹、影石、贝恩:Agent开始进业务现场了

猎豹、影石、贝恩:Agent开始进业务现场了

除了小鹏和Kimi,现场还有几类客户的站台,把Agent落地场景拉得更宽。

比如猎豹移动

傅盛在现场分享了猎豹移动的AI native转型。一个很直观的例子,是金山毒霸的变化。

过去,用户要一个按钮一个按钮点。现在用户可以直接说“我的打印机有问题”“显卡驱动能不能再快一点”“内存能不能优化一下”,系统就像电脑专家一样,以Agent方式帮用户解决问题。

猎豹移动还把内部AI实践做成了产品能力。

其EasyClaw出海企业版运行在Amazon Bedrock AgentCore之上,并依托Amazon Bedrock丰富的模型选择,按照任务复杂度灵活调度模型:简单任务用轻量模型,复杂任务用高性能模型,在效果和成本之间做平衡。

打开网易新闻 查看精彩图片

更重要的是,借助Bedrock AgentCore的无服务器模式,猎豹移动可以按使用量付费,没有客户访问时无需持续为闲置资源买单。现场信息显示,Agent上线时间从一个月缩短到两周,运营成本降低25%,部署和运维也得到简化。

这类能力最终落到出海营销场景里。

EasyClaw出海企业版面向跨境电商行业,从广告素材生产、投放优化到数据复盘,形成全链路AI赋能。

再比如影石Insta360

影石基于自研AI能力和十年影像技术积累,依托亚马逊云科技Agentic AI五层架构,推出了基于云的一站式智能成片能力——时刻Pro。

用户无需人工编辑,不到一分钟,就能从拍摄素材直接生成高质量成片。

这和小鹏、猎豹的场景完全不同,但底层逻辑是相通的:

Agent不再只是坐在聊天框里回答问题,而是进入一个具体业务流程,把原本需要多人、多系统、多步骤完成的事情,压缩成一个自动化闭环。

贝恩公司大中华区CEO丁杰的观点,则更像是给这些案例做了一个管理学注脚。

他认为,真正值得CEO关注的,不是技术本身,而是利用技术改变企业创造价值的方式,重塑企业竞争力。企业要围绕人机协同重新设计业务,让人负责判断、创意与责任,让数字员工负责速度、规模与执行,最终交付业务结果。

这句话放在今天的Agent热潮里,可以说是比较关键的。

因为过去一年,很多企业已经试过各种大模型、各种Agent demo。但从demo到生产,中间隔着一个巨大的工程鸿沟。

小鹏、Kimi、猎豹、影石这些案例的共同点,是它们都没有把Agent当成孤立工具,而是把Agent嵌进了研发、模型服务、出海营销、影像创作这些真实业务流里。

这也是亚马逊云科技想用客户案例带出的产品战略。

亚马逊云科技真正想讲的,是一整套Agent技术栈

亚马逊云科技真正想讲的,是一整套Agent技术栈

把这些案例拆开看,每家公司用到的产品并不一样。

  • 小鹏用Kiro、Amazon Bedrock、Amazon EKS搭内部AI编程和Agentic工作平台;
  • 月之暗面用亚马逊云科技全球基础设施、Amazon SageMaker、Marketplace、APN,并计划接入Amazon Bedrock;
  • 猎豹移动用Amazon Bedrock AgentCore和Amazon Bedrock跑生产级Agent;
  • 影石Insta360基于亚马逊云科技Agentic AI五层架构,把云端AI能力做成智能成片服务。

但这些产品拼起来,其实对应的是储瑞松在峰会上提出的企业Agentic业务转型五层技术栈

打开网易新闻 查看精彩图片

第一层,是AI基础设施。

包括GPU实例、自研Trainium AI加速芯片,以及配套网络、存储、弹性计算等底层能力。企业自己买芯片、建数据中心、做全球部署,成本和复杂度都很高。云厂商在这一层的价值,就是把算力、性能、稳定性和成本做到可用、可管、可扩展。

第二层,是模型层。

Amazon Bedrock提供统一入口,让企业按需调用多种领先大模型。对企业来说,模型选择不能锁死在一家厂商上。不同任务对智力水平、速度、上下文、成本的要求不同,模型也在快速迭代。Bedrock的价值,是把多模型选择变成一套统一API和治理能力。

第三层,是数据和知识层。

Agent能不能干活,很多时候不只取决于模型有多聪明,还取决于它有没有拿到企业自己的数据和上下文。亚马逊云科技在这一层提供Zero-ETL、Amazon S3 Vectors、专用向量数据库、Amazon Bedrock Knowledge Bases,以及Amazon Context等面向AI的数据服务,目的就是让企业过去静态存储的数据,变成AI可以理解、检索、调用的知识资产。

第四层,是Agentic平台层。

这是Amazon Bedrock AgentCore所在的位置。

企业早期只有几个Agent试点时,平台感不强;一旦Agent数量来到几十个、上百个,就会出现一堆现实问题:

例如谁给Agent身份?谁管理权限?它能调用哪些工具?过程能不能审计?成本怎么核算?等等……

Bedrock AgentCore要解决的,就是Agent从开发、运行到迭代的全生命周期管理。它支持企业统一管理Agent运行时、记忆、工具接入、身份、治理、可观测性、评估等能力。

第五层,是Agent应用层。

这层最接近业务结果,包括Kiro、Amazon Quick、Amazon Connect等产品。

Kiro面向软件开发,用Spec驱动开发,把需求、设计、任务和测试先结构化,再让AI写代码;Amazon Quick面向知识工作者,可以做研究、数据分析、工作流创建、自动化和知识中心;Amazon Connect则面向客户服务场景。

打开网易新闻 查看精彩图片

此外,亚马逊云科技还在安全方向推出Amazon Continuum等能力。它面向Agent时代的软件安全风险,覆盖发现、优先级排序、验证和修复,目标是在企业定义的护栏内,以机器速度处理安全问题。

这套产品全貌放在一起看,亚马逊云科技讲的并不是“我也有一个Agent产品”。

它讲的是从底层算力、模型选择、企业数据、Agent平台,到最终应用和安全治理,给企业补齐Agent进入生产环境所需要的一整套工程能力。

企业用Agent,难点从来不只是模型。

为什么很多企业用Agent,最后没起到理想效果?

因为很多企业一开始问的是:选哪个模型?用什么框架?要不要接一个聊天助手?

但真正跑进业务里,问题很快变成另一组:

数据散在多少系统里?权限边界怎么设?哪些环节必须有人审核?一个任务到底花了多少钱?多个Agent之间怎么协作?旧系统、旧代码、旧流程要不要重构?……问题真的不要太多……

而这也是小鹏案例值得看的地方。

它并没有停留在让某个开发者用AI写代码更快。恰恰相反,小鹏一开始也遇到了单点效率提升、整体效能没变的问题。直到Kiro、Bedrock、EKS、内部规范、Skills、数据知识层和SRE Agent被串成一条链路,AI才真正进入生产流程。

月之暗面也是类似逻辑。

模型做强之后,要服务全球企业,还需要全球基础设施、推理加速、训练部署平台、Marketplace分发和合作伙伴网络。

猎豹移动的故事则说明,企业要把Agent做成产品,还要解决成本、弹性、安全、部署、运维这些问题。尤其是无服务器模式和多模型调度,最终都是为了让Agent商业化时的单位经济模型更可控。

这也解释了为什么储瑞松在峰会上反复强调,AgenticAI不只是技术创新,更指向业务变革。

打开网易新闻 查看精彩图片

企业真正要做的,是从选择什么技术和工具,转向定义要达成什么业务结果;数据也要从静态资产,变成持续驱动Agent创造价值的战略资产;当成百上千个Agent开始和人类员工协同时,企业还必须有统一平台、清晰授权、可追溯决策和自动化审计能力。

正如亚马逊云科技全球数据库服务副总裁Ganapathy “G2” Krishnamoorthy与量子位交流过程中所说的:

技术已经非常有能力,也在快速演进;真正需要发生的,是领导力推动下的工作方式变化。这既是组织转型,也是技术进步。全球企业普遍会先通过PoC验证价值,再进入规模化使用阶段。

这句话其实戳到了Agent落地的关键。

Agentic AI不是IT部门多接入一个工具,也不是研发团队多用一个编程助手。它会改变企业分工:人类员工更偏判断、创意、责任,数字员工承担速度、规模和执行;管理者要编排人与Agent之间的协作,一线员工也要学会管理多个Agent。

这也是亚马逊云科技的独特位置。

在大模型最热闹的那一层,竞争者很多,模型能力也在快速追赶。但企业真正把Agent用起来,往往更需要模型之外的工程底座:

算力、数据、权限、治理、可观测性、安全、全球基础设施、生态分发,以及从PoC到生产的全生命周期管理。

这些能力,恰好是云计算公司过去二十年一直在做的事。

所以,“云计算一哥”这个说法听起来有点网感,但放到这场峰会上并不突兀。

亚马逊云科技并没有把自己包装成又一个模型玩家,而是继续站在构建者底座的位置上:企业想用谁的模型、想接什么数据、想跑什么Agent、想把应用部署到哪里,它都试图提供一条可落地、可治理、可扩展的路径。

从小鹏的灵犀,到Kimi的全球模型服务,再到猎豹移动的出海Agent和影石Insta360的智能成片,峰会上这些客户案例共同说明了一件事:

Agentic AI的拐点,已经不只发生在模型参数和榜单上。

它更具体地发生在企业内部的研发流、营销流、服务流、内容生产流里。

当Agent开始真正交付业务结果,云计算的价值也从提供资源,变成承载数字员工。

这大概就是小鹏用完之后,有点爽在身上的原因。