智能体落地元年，Agent Infra是关键一环｜对话腾讯云&Dify|agent|工作流|智能体|深度思考按钮|知名企业|腾讯云|量子

鹭羽发自凹非寺
量子位 | 公众号 QbitAI

毋庸置疑！2025年title属于「Agent元年」。

要说Agent这把火，一直从年初烧到了年末——

先是Manus，再到最近的豆包手机……Agent已然成为全行业的关注焦点。

而回顾这一年，也是Agent从技术萌芽，走向工程化落地的关键一年。

于是乎，量子位趁热打铁攒了场局，邀请来两位行业大拿——Dify开源生态负责人郑立和腾讯云云原生产品副总经理于广游做客，聊一聊他们眼里Agent落地过程中的挑战、机遇和未来：

从年初硅谷的宏大叙事，Agent正走向充满烟火气的务实。
行业之所以认可Agent，在于它真的在做事。
Agent真正落地，需要确定性的工程方法才能驾驭一个不确定性的复杂系统。
Agent Infra解决企业的偶然复杂度问题，而非本质复杂度。
对于中小公司或个人开发者，最大的门槛是缺乏勇气。

两位嘉宾还给出了一个高度一致的判断：

在智能体落地过程中，Agent Infra是关键一环。

下面一起跟随量子位的视角，看看他们具体都说了些什么，知识密度之高，不要轻易眨眼。

回顾Agent元年，技术走向工程落地

量子位：那我们今天先从Agent这个概念聊起吧。今年也要结束了，那站在年末，二位对这一年Agent的整体发展有什么印象和总结？

于广游：我今年对Agent的最主要看法还是，今年Agent已经从技术萌芽期，走到了真正工程性落地的阶段。我个人看到有三种比较标志性的实践：

面向企业内部的Agent：首先是像咱们Dify这类产品，通过确定性去驾驭不确定性，从而实实在在地帮助企业内部提效。
面向大众的Agent：那再比如说Manus和豆包，它俩通过新的交互形态点燃用户对Agent的想象力。
新范式Agent：而像Claude Code这样的产品，能够通过Agent RL和工具调用，拓宽Agent自身能力范围。

至于我个人印象比较深刻的应用，其实还是AI代码工具。我觉得一方面它不再只解决代码问题，它也正在成为Agent连接现实世界的通用接口。

第二个点是AI代码工具，切实改变了原先的软件工程范式，然后在我们内部，我们也做了大量的从AI Coding到AISE（AI Software Engineer）的调整，包括研发模式、组织管理、角色职责等。

郑立：其实这一年Agent发展吧，我能感受到就是大传统和小传统之间的鲜明张力。

大传统其实就比如说来自硅谷那些的宏大叙事，他们会许诺用全自动智能体取代白领，逻辑完美但实际落地的时候会有些水土不服。

那从小传统来看，会充满一些烟火气，比如我看到义乌商家使用AI自动回复客户，还有比如独立开发者会用工作流进行代码评审。

总结起来，这是蛮有趣味的一年，然后也是在走向务实。

年初的时候，一个简单的Demo就能吸引资本市场，可以类比“立法阶段”，那年末其实我们就会类似进入到“司法阶段”，开始处理具体的、琐碎的执行层面问题。

这不是线性的进步，更多像是根茎状的蔓延。

那我们也看到秩序的逐步建立，并非来自基座模型的升级，更多时候来自于那些“胶水”——如产品工程、提示词工程、RAG、Pipeline和工具使用等技术手段，虽然它们不够优雅，但确实能够有效地去维持我们数字社会的运转。

量子位：确实就像两位所说，可能年初的时候大家还是会被Demo惊艳，年末就到了更工程化的阶段。其实以我们科技媒体的视角来看，这个进程非常快。智能体为什么会这么快成为行业共识呢？

于广游：我觉得首先还是它能够真正做到解决问题。过去生产力的发展，本质上都是在延伸人类的手和脚，但实际我们工作中，确实也存在大量无法通过精确语言或编程描述的内容，需要Agent来解决。

然后其次就是，我们在落地过程中对工程方法的探索。今年有一系列工程方法快速成型，包括Agent Infra、Agent Runtime、不同的Agent架构范式、内容工程，这些技术帮助Agent实现了真正落地。

郑立：其实我感觉也差不多，不过在我看来，共识其实是资本在寻求新的组织方式。因为在我看来，互联网时代的红利已经被吃干抹净了，App的边际效用也在递减。

但是Agent承诺的是交互成本的一种坍塌，其实能看到权力从指令式计算到异度式计算的转移。

量子位：其实刚才两位也谈到了，今年有一些关键词都是在变化的，比如可能以前讲AI Infra，现在说Agent Infra。Agent落地与AI落地之间存在哪些区别？以及是否存在工作流的变化和对Infra需求的差异。

郑立：其实我觉得这个范式转移还是很明显的，我们从传统的那种if/else的逻辑判断转向到Agent的概率性目标规划。

放在过去，机器必须执行下一行代码，现在我们开发者更像是老师这种角色，通过Prompt、RAG和原则给予模型自由处理的空间。

区别还是在于新增了很多不确定性，比如传统软件工程中，Bug就是对规则的违反，而放到Agent工程里，失败其实是对我们意图的误解或概率上的漂移。我们没办法再像修Bug一样修复它，而是需要像教育孩子一样去约束或者说服Agent。

这不仅仅是工作流的变化，还有交付物的变化，比如说以前是确定的功能，那现在我们交付的就是一种概率性的能力，你没有办法明确定义它是否正确。

于广游：对，我感觉不确定性非常关键。我们团队内部观察到的是，Agent是不确定性的复杂系统。

那首先，Agent的效果通常是由七八个不同因素构成（模型本身、架构范式、Prompt、Content、工具选择和参数等）。这些子部件彼此之间又相互影响，我们很难明确它们的关系，所以Agent是一个复杂系统。

其次，对于同一个问题，你在不同时刻输入，Agent的输出，它也是不一样的，咱们称之为不确定性。那与之相反的，就是传统的微服务系统。

所以我认为工程师的工作方式必须进行这两点思维转变：

1、从工程思维转向科学实验思维：我们不能再仅仅依赖预先规划，而是要去建立一个评测体系，把里面环环相扣的复杂系统分解为单独的子系统，然后通过控制变量的方式，在科学实验中一步步驾驭Agent。

2、从Day One思维转向Day Two思维：我觉得我们对AI开发的思维也需要转变，过去Day One就代表代码已经上线给用户提供服务，下一步怎么优化看用户的需要；现在Day One只能够代表Agent能运行，效果的持续优化，也就是Day Two才是真正的开始。

所以我觉得Agent落地，不仅仅是靠几个巧妙的范式，我们需要循序渐进通过确定性的工程方法，才能驾驭一个不确定性的复杂系统，而这将带来Infra的重塑。

智能体落地，Agent Infra是关键一环

量子位：于老师刚刚也提到了整个工具的重塑。那从Infra角度来说，能详细讲一下腾讯云为加速Agent落地提供了哪些支持吗？

于广游：我刚刚说Agent的本质是不确定性的复杂系统，那它在上线过程中，我们首先要解决的最大问题其实是自主运行带来的破坏性风险。

所以我们团队选择从后往前解决。先解决Agent安全问题，我们在Agent Infra上，推出了Agent安全沙箱，给Agent提供了一个独立的执行环境。

然后我们再驾驭Agent的不确定性和复杂性，为此我们会提供一系列的可观测性工具以及评估工具。

再进一步，我们就要进行效果的提升，对Agent的记忆和学习能力进行优化，比如元宝就已经进入了这一阶段。在积累相关经验后，我们也会提供相应的服务。

量子位：那包括您刚刚提到的Agent Runtime、安全沙箱这类Infra产品，和我们这些Agent平台之间有什么关系呢？以及腾讯Infra当前在关注什么？

于广游：首先我们要厘清一个概念——Agent Infra到底是什么，我们可以先把企业问题划分为本质复杂度和偶然复杂度两种，前者是必须要解决的问题，后者会随着工具和方法选择存在一定的偶然性。

所以我觉得，Infra层其实就是解决企业在问题处理过程中，遇到的偶然复杂问题，但是这个问题是没有定下来的，对于不同的场景，要面临的偶然复杂度完全不同，具体要解决什么问题也要视情况而定。

不过无论解决什么问题，这里都有一个共性问题，这也是我们团队现在做的，就是去构建偶然复杂度问题的最大公共子集，包括：安全、执行环境、工具、记忆和观测。

而这些问题或多或少都有解决方案，其中我们认为最突出的一个问题就是Agent的自主运行。

所以我们团队做的安全沙箱，并不是简单的隔离环境，而是一个多层次、全链路的Agent运行安全体系。

量子位：那郑老师这边，您在提供Agent Runtime这类底层组件时，Dify是更倾向于自研还是说使用第三方产品，以及您对Agent Infra开闭源有什么看法吗？

郑立：我们本身的话，核心模块还是选择自研，我们觉得如果这些使用第三方组件，势必会导致核心组件不可控、给用户的服务质量无法保证，而其它的我们也会选择一些合适的开闭源方案。

然后开源这件事我们是这样认为的，AI时代基础模型可以是黑箱，但Infra必须是白箱，因为开发者需要看到底层代码，想了解Agent行为逻辑。而且我们观察到，对于初创公司和创新者，他们会选择开源，因为这里有一种低成本和灵活性。

相反，那些大企业则更加倾向于选择开源的商业版本或闭源版本，因为闭源实则是给大企业提供了责任转移与兜底服务。

量子位：于老师，根据您这边接触用户的经验来看，他们在选择Agent Infra产品时，一般会比较关注哪些要素？

于广游：我觉得，首先对核心的业务逻辑层，我看到用户还是在意它是不是开源的，因为这样他们就可以围绕自己的业务进行任意修改，也会更透明更可控。

那具体到Infra层上，用户更在意体验是否极致、能否降低开发成本。在用户使用时，用户就更在意Agent的稳定性和效率，那么在这种情况下，我觉得闭源是有非常好的优势的。

量子位：听二位这样讲下来，我感觉在Agent这个领域里，开闭源正在形成分层互补，那么在这样的结构下，像那种小白开发者或者个人开发者能够通过Agent Infra把Agent开发和落地简化到一个什么程度？

郑立：其实这样我们会逼近于AI开发的一个Excel时刻。

这种简化其实是非常激进的，它会把基础设施的认知负荷降到最低，然后你就可以把全部精力集中在Prompt和数据治理上。

于广游：我补充一下，我们腾讯云的Infra产品就更偏向于专业开发者，他们会有非常多的复杂度问题需要治理，所以我们主要还是面向Agent原生企业和AI原生企业，去帮助他们加速Agent落地过程。

量子位：想请两位老师来帮我们总结一下，你观察到的Agent Infra技术进展或趋势。

于广游：我还是前面提到的AI Coding，我对这个事情印象非常深刻。

首先过去一年里，我能看到代码不仅是大模型抽象能力的来源，也正在成为Agent驾驭不确定性、连接世界的工具。

就拿AI Coding来说，它带来的是开发模式的颠覆改变，能够做到让我们团队里的每一个开发者，在分钟级就能拉起一个独立的全套开发环境，所以我觉得代码肯定是会产生全面影响的。

我认为任何一个工程师或者Agent从业者，都绝不能小觑Coding的影响，它非常之重要。

郑立：就我们个人而言，过去一年我们都在做自己的事情，主要的技术进展也都集中在补齐我们的短板。我们也看到了一个比较清晰的趋势，就是技术正在从开发者向非开发者移动。

量子位：如果现在让你们拿三个词限定的话，您能再讲讲Agent Infra为什么说是智能体落地应用的关键环节吗？

郑立：我先说吧，我认为主要是以下三点：

秩序：首先它会让混乱的模型变得可控；
连接：其次我们需要打通Agent孤岛，让AI真正融入到业务中去；
自动：接下来就是将简单繁琐的任务去变得自动化。

于广游：我想到的是这三点：

安全高效：第一个是我们去落地Agent的关键，就是让它能够安全高效地跑起来；
智能进化：第二步就是我们去优化Agent本身的这个能力，无论是通过知识库、记忆还是Agent RL进化它；
人机协同：那么要实现Agent的进化，就需要人类作为老师去教Agent。

Agent Infra的下一步

量子位：最后还是来展望一下，刚刚都在聊过去一年，那对于未来的一到两年，甚至三到五年时间里，各位觉得Agent Infra接下来的重点会是哪些方向？

于广游：对我而言，我们最关注的是Agent Infra如何服务好Agent，能够确保其安全可靠运行。

我其实觉得Agent Infra和AI Infra是交叉的关系，当我们把Agent运行好后，就会发现它的一些不足，然后我们再将产生的数据进行利用，就能对Agent本身和Agent模型进行持续优化。

当前的Infra体系，它更多的是服务于基础大模型本身的能力和智力的进化，而不是业务可用，所以我认为Agent Infra的下一步，一定是从服务好Agent的运行构建到服务好Agent的智能进化。

郑立：我这边会更加关注Agent Infra的可调试性，也就是看清楚是哪一步Agent理解错误，需要去做推理链的可视化调试。

然后就是记忆管理，不仅仅是声音的那种向量搜索，还有就是关注语义化的情景记忆和可计算的时间观吧。我理解中，Agent的记忆不能是简单的常量存储，而应该是一种变量，Agent的目标在执行过程中可能会被重写、降级，所以我们需要对目标进行一些置信度处理。

量子位：好，那感谢两位老师的分享，最后我们来回答几个观众问题吧。第一个问题，从你们的角度看，中小公司和个人开发者他们来做Agent应用最大的门槛是什么？是技术还是成本？

于广游：我感觉这两个都不是，应该是商业模式。

既然是中小公司，那肯定是要赚钱的，但是现在AI Agent还没有到改变整个社会商业模式的程度，这个时候产生的新消费和新的生产力变革还只发生在小领域。

所以如果希望把它应用到你的公司产品中去，我觉得更多的是，创业者需要回到实际问题中解决，同时也可以尝试着把自己的商业模式和形态进行一个巨大的转变。

郑立：我也觉得技术不是问题，你比方说现在大模型智力本身已经过剩了。真正最大的困难，我还是觉得在于企业数据的壁垒和缺乏开始的勇气。

量子位：最后一个观众问题交给于老师，您觉得如果未来Agent成为主流，会对现在的移动开发生态造成什么影响？它们会被彻底颠覆吗？

于广游：OK，我觉得这个可以要从应用交互形态和开发方式两个角度去讨论。

首先第一个对于形态，我觉得移动端（iOS/Android）形态没有人能给出确切答案。

在Agent的这个形态之外，我们就会立马面临两个问题：

APP集成Agent能力：第一个问题是公司会希望你在APP中集成一些Agent能力，这时开发者就需要将思维从工程转向科学实验，我觉得这个转型是非常巨大的。
利用AI Coding工具开发APP：第二是你所在的公司可能会让你使用AI Coding去开发，那么开发者就不能只用它来生成代码，更要用它来改变你们的协同模式和工具体系。

我相信，只有与AI工具为伍、改造研发流程，并用科学实验思维驾驭不确定性的人，才能抓住未来Agent形态转移的机遇。