鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI

毋庸置疑!2025年title属于「Agent元年」

要说Agent这把火,一直从年初烧到了年末——

先是Manus,再到最近的豆包手机……Agent已然成为全行业的关注焦点。

而回顾这一年,也是Agent从技术萌芽,走向工程化落地的关键一年

打开网易新闻 查看精彩图片

于是乎,量子位趁热打铁攒了场局,邀请来两位行业大拿——Dify开源生态负责人郑立和腾讯云云原生产品副总经理于广游做客,聊一聊他们眼里Agent落地过程中的挑战、机遇和未来:

  • 从年初硅谷的宏大叙事,Agent正走向充满烟火气的务实。
  • 行业之所以认可Agent,在于它真的在做事。
  • Agent真正落地,需要确定性的工程方法才能驾驭一个不确定性的复杂系统。
  • Agent Infra解决企业的偶然复杂度问题,而非本质复杂度。
  • 对于中小公司或个人开发者,最大的门槛是缺乏勇气。

两位嘉宾还给出了一个高度一致的判断:

  • 在智能体落地过程中,Agent Infra是关键一环。

下面一起跟随量子位的视角,看看他们具体都说了些什么,知识密度之高,不要轻易眨眼。

打开网易新闻 查看精彩图片

回顾Agent元年,技术走向工程落地

回顾Agent元年,技术走向工程落地

量子位:那我们今天先从Agent这个概念聊起吧。今年也要结束了,那站在年末,二位对这一年Agent的整体发展有什么印象和总结?

于广游:我今年对Agent的最主要看法还是,今年Agent已经从技术萌芽期,走到了真正工程性落地的阶段。我个人看到有三种比较标志性的实践:

  • 面向企业内部的Agent:首先是像咱们Dify这类产品,通过确定性去驾驭不确定性,从而实实在在地帮助企业内部提效。
  • 面向大众的Agent:那再比如说Manus和豆包,它俩通过新的交互形态点燃用户对Agent的想象力。
  • 新范式Agent:而像Claude Code这样的产品,能够通过Agent RL和工具调用,拓宽Agent自身能力范围。

至于我个人印象比较深刻的应用,其实还是AI代码工具。我觉得一方面它不再只解决代码问题,它也正在成为Agent连接现实世界的通用接口。

第二个点是AI代码工具,切实改变了原先的软件工程范式,然后在我们内部,我们也做了大量的从AI Coding到AISE(AI Software Engineer)的调整,包括研发模式、组织管理、角色职责等。

郑立:其实这一年Agent发展吧,我能感受到就是大传统和小传统之间的鲜明张力。

大传统其实就比如说来自硅谷那些的宏大叙事,他们会许诺用全自动智能体取代白领,逻辑完美但实际落地的时候会有些水土不服。

那从小传统来看,会充满一些烟火气,比如我看到义乌商家使用AI自动回复客户,还有比如独立开发者会用工作流进行代码评审。

总结起来,这是蛮有趣味的一年,然后也是在走向务实

年初的时候,一个简单的Demo就能吸引资本市场,可以类比“立法阶段”,那年末其实我们就会类似进入到“司法阶段”,开始处理具体的、琐碎的执行层面问题。

这不是线性的进步,更多像是根茎状的蔓延。

那我们也看到秩序的逐步建立,并非来自基座模型的升级,更多时候来自于那些“胶水”——如产品工程、提示词工程、RAG、Pipeline和工具使用等技术手段,虽然它们不够优雅,但确实能够有效地去维持我们数字社会的运转。

量子位:确实就像两位所说,可能年初的时候大家还是会被Demo惊艳,年末就到了更工程化的阶段。其实以我们科技媒体的视角来看,这个进程非常快。智能体为什么会这么快成为行业共识呢?

于广游:我觉得首先还是它能够真正做到解决问题。过去生产力的发展,本质上都是在延伸人类的手和脚,但实际我们工作中,确实也存在大量无法通过精确语言或编程描述的内容,需要Agent来解决。

然后其次就是,我们在落地过程中对工程方法的探索。今年有一系列工程方法快速成型,包括Agent Infra、Agent Runtime、不同的Agent架构范式、内容工程,这些技术帮助Agent实现了真正落地。

郑立:其实我感觉也差不多,不过在我看来,共识其实是资本在寻求新的组织方式。因为在我看来,互联网时代的红利已经被吃干抹净了,App的边际效用也在递减。

但是Agent承诺的是交互成本的一种坍塌,其实能看到权力从指令式计算到异度式计算的转移。

量子位:其实刚才两位也谈到了,今年有一些关键词都是在变化的,比如可能以前讲AI Infra,现在说Agent Infra。Agent落地与AI落地之间存在哪些区别?以及是否存在工作流的变化和对Infra需求的差异。

郑立:其实我觉得这个范式转移还是很明显的,我们从传统的那种if/else的逻辑判断转向到Agent的概率性目标规划。

放在过去,机器必须执行下一行代码,现在我们开发者更像是老师这种角色,通过Prompt、RAG和原则给予模型自由处理的空间。

打开网易新闻 查看精彩图片

区别还是在于新增了很多不确定性,比如传统软件工程中,Bug就是对规则的违反,而放到Agent工程里,失败其实是对我们意图的误解或概率上的漂移。我们没办法再像修Bug一样修复它,而是需要像教育孩子一样去约束或者说服Agent。

这不仅仅是工作流的变化,还有交付物的变化,比如说以前是确定的功能,那现在我们交付的就是一种概率性的能力,你没有办法明确定义它是否正确。

于广游:对,我感觉不确定性非常关键。我们团队内部观察到的是,Agent是不确定性的复杂系统。

那首先,Agent的效果通常是由七八个不同因素构成(模型本身、架构范式、Prompt、Content、工具选择和参数等)。这些子部件彼此之间又相互影响,我们很难明确它们的关系,所以Agent是一个复杂系统。

其次,对于同一个问题,你在不同时刻输入,Agent的输出,它也是不一样的,咱们称之为不确定性。那与之相反的,就是传统的微服务系统。

所以我认为工程师的工作方式必须进行这两点思维转变:

1、从工程思维转向科学实验思维:我们不能再仅仅依赖预先规划,而是要去建立一个评测体系,把里面环环相扣的复杂系统分解为单独的子系统,然后通过控制变量的方式,在科学实验中一步步驾驭Agent。

2、从Day One思维转向Day Two思维:我觉得我们对AI开发的思维也需要转变,过去Day One就代表代码已经上线给用户提供服务,下一步怎么优化看用户的需要;现在Day One只能够代表Agent能运行,效果的持续优化,也就是Day Two才是真正的开始。

所以我觉得Agent落地,不仅仅是靠几个巧妙的范式,我们需要循序渐进通过确定性的工程方法,才能驾驭一个不确定性的复杂系统,而这将带来Infra的重塑。

智能体落地,Agent Infra是关键一环

智能体落地,Agent Infra是关键一环

量子位:于老师刚刚也提到了整个工具的重塑。那从Infra角度来说,能详细讲一下腾讯云为加速Agent落地提供了哪些支持吗?

于广游:我刚刚说Agent的本质是不确定性的复杂系统,那它在上线过程中,我们首先要解决的最大问题其实是自主运行带来的破坏性风险。

所以我们团队选择从后往前解决。先解决Agent安全问题,我们在Agent Infra上,推出了Agent安全沙箱,给Agent提供了一个独立的执行环境。

然后我们再驾驭Agent的不确定性和复杂性,为此我们会提供一系列的可观测性工具以及评估工具。

再进一步,我们就要进行效果的提升,对Agent的记忆和学习能力进行优化,比如元宝就已经进入了这一阶段。在积累相关经验后,我们也会提供相应的服务。

量子位:那包括您刚刚提到的Agent Runtime、安全沙箱这类Infra产品,和我们这些Agent平台之间有什么关系呢?以及腾讯Infra当前在关注什么?

于广游:首先我们要厘清一个概念——Agent Infra到底是什么,我们可以先把企业问题划分为本质复杂度和偶然复杂度两种,前者是必须要解决的问题,后者会随着工具和方法选择存在一定的偶然性。

所以我觉得,Infra层其实就是解决企业在问题处理过程中,遇到的偶然复杂问题,但是这个问题是没有定下来的,对于不同的场景,要面临的偶然复杂度完全不同,具体要解决什么问题也要视情况而定。

不过无论解决什么问题,这里都有一个共性问题,这也是我们团队现在做的,就是去构建偶然复杂度问题的最大公共子集,包括:安全、执行环境、工具、记忆和观测。

打开网易新闻 查看精彩图片

而这些问题或多或少都有解决方案,其中我们认为最突出的一个问题就是Agent的自主运行

所以我们团队做的安全沙箱,并不是简单的隔离环境,而是一个多层次、全链路的Agent运行安全体系。

量子位:那郑老师这边,您在提供Agent Runtime这类底层组件时,Dify是更倾向于自研还是说使用第三方产品,以及您对Agent Infra开闭源有什么看法吗?

郑立:我们本身的话,核心模块还是选择自研,我们觉得如果这些使用第三方组件,势必会导致核心组件不可控、给用户的服务质量无法保证,而其它的我们也会选择一些合适的开闭源方案。

然后开源这件事我们是这样认为的,AI时代基础模型可以是黑箱,但Infra必须是白箱,因为开发者需要看到底层代码,想了解Agent行为逻辑。而且我们观察到,对于初创公司和创新者,他们会选择开源,因为这里有一种低成本和灵活性。

相反,那些大企业则更加倾向于选择开源的商业版本或闭源版本,因为闭源实则是给大企业提供了责任转移与兜底服务。

量子位:于老师,根据您这边接触用户的经验来看,他们在选择Agent Infra产品时,一般会比较关注哪些要素?

于广游:我觉得,首先对核心的业务逻辑层,我看到用户还是在意它是不是开源的,因为这样他们就可以围绕自己的业务进行任意修改,也会更透明更可控。

那具体到Infra层上,用户更在意体验是否极致、能否降低开发成本。在用户使用时,用户就更在意Agent的稳定性和效率,那么在这种情况下,我觉得闭源是有非常好的优势的。

量子位:听二位这样讲下来,我感觉在Agent这个领域里,开闭源正在形成分层互补,那么在这样的结构下,像那种小白开发者或者个人开发者能够通过Agent Infra把Agent开发和落地简化到一个什么程度?

郑立:其实这样我们会逼近于AI开发的一个Excel时刻

打开网易新闻 查看精彩图片

这种简化其实是非常激进的,它会把基础设施的认知负荷降到最低,然后你就可以把全部精力集中在Prompt和数据治理上。

于广游:我补充一下,我们腾讯云的Infra产品就更偏向于专业开发者,他们会有非常多的复杂度问题需要治理,所以我们主要还是面向Agent原生企业和AI原生企业,去帮助他们加速Agent落地过程。

量子位:想请两位老师来帮我们总结一下,你观察到的Agent Infra技术进展或趋势。

于广游:我还是前面提到的AI Coding,我对这个事情印象非常深刻。

首先过去一年里,我能看到代码不仅是大模型抽象能力的来源,也正在成为Agent驾驭不确定性、连接世界的工具。

就拿AI Coding来说,它带来的是开发模式的颠覆改变,能够做到让我们团队里的每一个开发者,在分钟级就能拉起一个独立的全套开发环境,所以我觉得代码肯定是会产生全面影响的。

我认为任何一个工程师或者Agent从业者,都绝不能小觑Coding的影响,它非常之重要。

郑立:就我们个人而言,过去一年我们都在做自己的事情,主要的技术进展也都集中在补齐我们的短板。我们也看到了一个比较清晰的趋势,就是技术正在从开发者向非开发者移动。

量子位:如果现在让你们拿三个词限定的话,您能再讲讲Agent Infra为什么说是智能体落地应用的关键环节吗?

郑立:我先说吧,我认为主要是以下三点:

  • 秩序:首先它会让混乱的模型变得可控;
  • 连接:其次我们需要打通Agent孤岛,让AI真正融入到业务中去;
  • 自动:接下来就是将简单繁琐的任务去变得自动化。

于广游:我想到的是这三点:

  • 安全高效:第一个是我们去落地Agent的关键,就是让它能够安全高效地跑起来;
  • 智能进化:第二步就是我们去优化Agent本身的这个能力,无论是通过知识库、记忆还是Agent RL进化它;
  • 人机协同:那么要实现Agent的进化,就需要人类作为老师去教Agent。
Agent Infra的下一步

Agent Infra的下一步

量子位:最后还是来展望一下,刚刚都在聊过去一年,那对于未来的一到两年,甚至三到五年时间里,各位觉得Agent Infra接下来的重点会是哪些方向?

于广游:对我而言,我们最关注的是Agent Infra如何服务好Agent,能够确保其安全可靠运行

我其实觉得Agent Infra和AI Infra是交叉的关系,当我们把Agent运行好后,就会发现它的一些不足,然后我们再将产生的数据进行利用,就能对Agent本身和Agent模型进行持续优化。

打开网易新闻 查看精彩图片

当前的Infra体系,它更多的是服务于基础大模型本身的能力和智力的进化,而不是业务可用,所以我认为Agent Infra的下一步,一定是从服务好Agent的运行构建到服务好Agent的智能进化。

郑立:我这边会更加关注Agent Infra的可调试性,也就是看清楚是哪一步Agent理解错误,需要去做推理链的可视化调试。

然后就是记忆管理,不仅仅是声音的那种向量搜索,还有就是关注语义化的情景记忆和可计算的时间观吧。我理解中,Agent的记忆不能是简单的常量存储,而应该是一种变量,Agent的目标在执行过程中可能会被重写、降级,所以我们需要对目标进行一些置信度处理。

量子位:好,那感谢两位老师的分享,最后我们来回答几个观众问题吧。第一个问题,从你们的角度看,中小公司和个人开发者他们来做Agent应用最大的门槛是什么?是技术还是成本?

于广游:我感觉这两个都不是,应该是商业模式

既然是中小公司,那肯定是要赚钱的,但是现在AI Agent还没有到改变整个社会商业模式的程度,这个时候产生的新消费和新的生产力变革还只发生在小领域。

所以如果希望把它应用到你的公司产品中去,我觉得更多的是,创业者需要回到实际问题中解决,同时也可以尝试着把自己的商业模式和形态进行一个巨大的转变。

郑立:我也觉得技术不是问题,你比方说现在大模型智力本身已经过剩了。真正最大的困难,我还是觉得在于企业数据的壁垒缺乏开始的勇气

打开网易新闻 查看精彩图片

量子位:最后一个观众问题交给于老师,您觉得如果未来Agent成为主流,会对现在的移动开发生态造成什么影响?它们会被彻底颠覆吗?

于广游:OK,我觉得这个可以要从应用交互形态和开发方式两个角度去讨论。

首先第一个对于形态,我觉得移动端(iOS/Android)形态没有人能给出确切答案。

在Agent的这个形态之外,我们就会立马面临两个问题:

  • APP集成Agent能力:第一个问题是公司会希望你在APP中集成一些Agent能力,这时开发者就需要将思维从工程转向科学实验,我觉得这个转型是非常巨大的。
  • 利用AI Coding工具开发APP:第二是你所在的公司可能会让你使用AI Coding去开发,那么开发者就不能只用它来生成代码,更要用它来改变你们的协同模式和工具体系。

我相信,只有与AI工具为伍、改造研发流程,并用科学实验思维驾驭不确定性的人,才能抓住未来Agent形态转移的机遇

打开网易新闻 查看精彩图片