见实最近和很多人聊 Agent,发现大家对它的看法正在明显分化。

一派觉得它已经很好用,不只是每天在用,甚至开始往公司业务里落地;另一派则觉得它泡沫很大,很多场景没有想象中成熟,装上以后也未必比 GPT、DeepSeek 更顺手。

这两种感受都很真实。因为 Agent 的关键,已经不只是“能不能回答好一个问题”,而是能不能稳定地拆解业务、调用工具、衔接工作流,并在下一次任务里继续复用之前沉淀下来的经验。

前段时间,龙虾的爆火进一步放大了这个趋势:AI 正在从“对话式”走向“员工式”。过去几年,AI 的重点是变得更会想、更会答;接下来更大的变化,是我们开始教 AI 去行动。

但行动意味着复杂性。聊天型 AI 只要回答得好就行,Agent 却要处理记忆、Skill、工具、权限、表格、知识库和工作流它能不能稳定,不只取决于模型能力,也取决于人的经验有没有被系统接住。

在见实前段时间的AI主题私享会上,铭文鼎成科技创始人陈一铭把这个逻辑拆得很细:Agent 如何从一次性的对话能力,变成可以反复调用的系统能力?

打开网易新闻 查看精彩图片

本文即为这次分享的精华实录(保留了第一人称)。,欢迎加入会员一起。

打开网易新闻 查看精彩图片

铭文鼎成科技创始人 陈一铭

01Agent 真正稳定起来,是从经验离开聊天窗口开始的

很多时候,Agent 不是不会做,而是它每次都在重新理解你。

前面聊得好好的,规则说了,偏好讲了,流程也调顺了。但一换窗口,或者上下文一长,它突然就开始跑偏。我前期也被这个坑过。后来发现,问题不一定在模型,而是我们总会习惯性忽视模型的上下文调用问题。

比如你用 OpenClaw 和它磨出一套客户分析逻辑:先看行业,再看预算、项目阶段、最近沟通记录,最后判断客户应该优先跟进,还是暂时观察。这套逻辑如果只停在当前对话里,就是一次性的。今天有用,明天换个窗口,又要重新解释。

所以真正要解决的,不是让 Agent “记得更多”,而是判断:这条信息以后还该不该被调用?如果要被调用,它应该停在哪一层?

我一般把记忆分成四层:

首先是身份规则层。这一层最稳定。它是谁,服务谁,价值观是什么,会影响它面对任务时的基本判断。比如我自己的文档里,会写清楚:我是谁、做什么、喜欢什么风格、不喜欢废话、喜欢把问题搞清楚。

打开网易新闻 查看精彩图片

这些内容本质上是在控制模型:它处理事情时,到底能看到什么。这也对应 OpenClaw 这类 Agent 很重要的哲学:一切皆文本。大模型本身是黑盒,你很难直接控制它怎么想,但你可以控制它看什么。身份设定、行为准则、任务说明、项目背景,都是写给模型看的上下文。

所以后端那些 markdown 文档不是装饰,而是 Agent 的“可编辑记忆”。你直接在后台改文档,它后面理解任务的方式就会跟着变。因此,Agent 的核心能力,不只是模型能力,而是上下文管控能力。

第二,Skill 层:反复出现的流程,要变成可调用能力。Skill 层最大的特点是动态调度。你需要它的时候,它就上;不需要的时候,它就走。比如客户优先级分析、邮件分类、日报生成、视频切片、内容选题、CRM 商机新增,都不应该每次靠临时对话重新解释,而应该把当前窗口里已经跑通的逻辑上提为 Skill。这也是处理上下文截断的一个小技巧。

打开网易新闻 查看精彩图片

比如指令可以说:

>把这套客户分析逻辑封装成一个 Skill,触发条件是我说“分析客户优先级”;输入包括行业、预算、阶段、最近沟通记录;输出包括优先级、判断理由、下一步动作。

这样它就不再只是一次对话里的临时能力,而是后面可以反复调用的能力,这也是最近很火的Hermes的突出优势。

第三,长期记忆层,适合存你的名字、表达偏好、常用工具、关注客户、关键项目、长期有效的业务规则,但也要注意不能当成垃圾桶。如果把一次性的临时判断写进去,后面可能会误用。比如某个客户这次预算紧张,只是当前阶段情况;如果被当成长期标签,后面所有分析都默认这个客户预算紧张,就会污染判断。

第四,临时会话层,最灵活,也最不稳定。比如这篇文章怎么改、这次会议讨论了什么、某个临时判断、只对当前任务有效的限制条件,都可以留在会话里。但它不适合承担长期能力。

所以我的判断标准很简单:

只对当前任务有效的信息,留在会话里;

反复出现的偏好和背景,进入长期记忆;

已经跑通的处理流程,封装成 Skill;

需要协作和追踪的结果,进入表格、知识库或业务系统。

接下来必须要提及渠道会话,也会影响记忆调用。它不是简单的聊天入口,背后还有配对码、白名单、防干扰等机制,它决定的是生态位、权限和记忆加载方式。

打开网易新闻 查看精彩图片

比如大家可能遇到过这样的问题,你在群组里@一个智能体,让它调用记忆里存过的数据,结果它答不上来,不一定是它没记住,而是当前通道没有加载那部分 memory 文档。所以记忆调度会落到这些具体问题上:

- 当前信息要不要进入长期记忆;

- 当前流程要不要封装成 Skill;

- 当前通道有没有权限;

- 群组里有没有加载对应记忆;

- 白名单和配对有没有完成;

- 当前任务该不该读取某个项目文档。

这些问题想清楚了,Agent 才不会每次都重新理解你。

02Skill 再完整,触发条件模糊,就等于半失效

如果说记忆解决的是“信息应该放在哪里”,Skill 解决的就是“任务来了以后,能力怎么被调用”。

很多人把 Skill 理解成一句提示词,比如“帮我分析客户”“帮我剪视频”“帮我写日报”,这不够。真正能稳定运行的 Skill,不是一句话,而是一个包括元数据、脚本和资源模板的技能包。它至少要讲清楚:

- 适用场景;

- 触发条件;

- 输入字段;

- 执行步骤;

- 调用工具;

- 输出格式;

- 质量约束;

- 异常反馈。

这里最容易被忽略的是触发条件。比如一个 Skill 叫“客户处理”,就太泛了。它到底是新增客户、分析客户、生成客户日报,还是提醒销售跟进?Agent 不一定能判断。但如果写成“客户优先级分析”,适用场景是“当用户要求判断客户成交概率、跟进顺序或丢单风险时使用”,就明确很多。

任务进来后,Agent 不会先把所有 Skill 全部读完。它会先看 Skill 的标题、摘要、描述这些元数据,再决定是否加载脚本、文档和素材。这就是渐进披露。所以 Skill 的标题、摘要、触发条件,不是装饰,而是调用判断依据

还有一个容易搞错的地方:覆盖面最广的 Skill,不一定优先级最高。项目级 Skill 的优先级往往最高,但只在当前项目里生效;全局 Skill 覆盖面更广,但优先级在中间;默认层最低。如果不同层放了同名 Skill,最后执行的往往是更高优先级那一个。

打开网易新闻 查看精彩图片

所以有时你明明配了 Skill,结果它不执行,不一定是没配好,也可能是被覆盖了。这时候要么换名字,要么换一层配置逻辑。

现在封装 Skill 的门槛已经低很多,很多时候一句话就能开始:

> 现在想做一件事,你把这件事变成一套执行逻辑,再把这套逻辑写进文档,存到记忆库里。

当然,做出来不等于做好,我会建议加一些辅助要求:

> 每次运行完,告诉我本次任务执行时长。

如果一个任务平时 30 秒做完,另一个任务跑了 10 分钟,那肯定有问题。下一步就该追问:

> 你为什么执行了 10 分钟?你的执行逻辑是什么?

总之,Skill 的优化,是从基础版,到复合版,再到长期可复用版,一层层磨出来的。

打开网易新闻 查看精彩图片

03AI工作流落地的关键,是把判断交给模型,把动作交给工具

前面讲的会话层、记忆层、Skill,最后都要落到工作流里。Agent 真正进入业务,不是因为它能聊,而是因为它能把判断结果交给系统继续执行。

关键是分工:模型负责理解、判断、排序、筛选;工具负责写入、裁剪、提醒、发布、同步;表格和知识库负责承接结构化结果;权限系统负责控制边界。

下面这些案例,表面上是个人助理、信息流、内容生产、视频切片、CRM,底层都是同一件事:把人的任务结构化到系统能继续执行的位置上。

第一,日程和邮箱:把高频切换结构化成固定流程。

打开网易新闻 查看精彩图片

个人助理真正比的不是快慢,而是:这个事到底还要不要我干。日程和邮箱很适合先做,因为它们不复杂,但高频打断。以前排日程,你要打开日历或 OA,填写时间、地点、提醒方式。现在只要语音说“帮我登记今天几点干什么”,它就能规划并提醒。

打开网易新闻 查看精彩图片

邮箱也是一样。订阅信息、项目邮件、邀约、询盘,可以先让 Agent 分成重要、一般、大项目相关、待处理几类。这里真正省掉的,不是几分钟操作,而是反复切换注意力的小判断。

第二,信息流:把资讯结构化进知识库和业务字段。

现在 AI 更新太快,有些团队还特别喜欢半夜发。你晚上 12 点准备睡了,它突然发一个新模型,你就不用睡了,得起来测、起来看,所以要先保住自己的注意力。

打开网易新闻 查看精彩图片

可以让 Agent 做信源整理和日报提醒。比如设定关心的热点:AI 领域,国内看阿里、腾讯,国外看 OpenAI、谷歌,看看他们最近发了什么模型、什么框架。提醒频率可以是每天早上、中午各一次,也可以是一周一次。

方式有两种:一种是自己上网扒拉,另一种是通过接口拿数据。像 Twitter、YouTube 这些平台,都有相应接口,可以直接抓热点,再判断是否纳入信息流。但信息流不能只停在“总结一下”。真正有价值的是,它能不能进入知识库和业务字段。

比如一个制造业 AI 质检案例,如果只是收藏,后面很难被调用。但如果进入表格,字段写清楚:行业、场景、痛点、解决方案、适合客户、销售话术、可转化选题,它后面就能和 CRM 里的制造业客户发生关系。

我自己的做法是:既然已经绑定飞书,就直接在飞书生态里解决。信息源、数据、文章扔进去,它会先帮我更新成云文档,再自动进入项目目录。

这里调用的是一整套权限:云文档权限、知识库权限、多维表格权限。底层逻辑就是:先筛选,再结构化,再沉淀到系统里。只有这样,信息后面才有机会参与内容选题、客户沟通、项目复盘。

第三,内容生产:把热点结构化成多维表架构。

从个人助理再往外走,就是公域内容。公域本质上拼三件事:发布频率、内容质量、渠道覆盖。以前这件事可能要专门配一个团队。现在一个 Agent 已经能承担其中相当一部分。但前提是,你不能只让它“写一篇”。

打开网易新闻 查看精彩图片

比如我让它分析全网热点、邮箱订阅信源,再检索最近一周 AI 方向适合我做自媒体的话题,然后把结果存进一个自媒体文档。这个时候关键能力是多维表格。前面抓信源、抓热点,是一层。存完以后,它还能在多维表格里生成字段,比如选题、核心观点、目标人群、适合平台、参考素材、AI 提示词、配图提示词、发布状态、数据反馈。

因此可以说,内容生产的自动化上限,取决于多维表架构字段一旦清楚,公众号版本、小红书版本、视频版本,都可以继续往下接。原来只是“热点收集”,一旦进入多维表格,就可能变成完整内容矩阵的起点。

因此,真正重要的不是 AI 会不会写稿,而是热点进入系统以后,多维表格能不能继续接流程、接字段、接自动化。如果某个字段触发条件成立后,能自动提醒、自动推送,甚至进入多平台分发;发完以后,数据还能再拉回来继续分析,那系统办公就打通成了一个闭环。

第四,视频切片:把视频先转化为带时间戳的文本。

视频切片最开始看起来很简单:发一个 5 分钟视频,让它提炼成 3 分钟左右的精彩切片。但真正难的不是能不能切,而是怎么切得合理、便宜、稳定。

打开网易新闻 查看精彩图片

第一个坑是存储。素材太大,本地和服务器都不适合长期扛,所以最好放企业网盘,比如阿里云企业网盘,用共享链接进入流程。这样可控,不占本地和服务器空间,分享也方便。

第二个坑是 token。不要把整段视频直接交给大模型理解。原理没错,但 token 扛不住。如果 5 分钟视频都这么跑,一百个视频跑完,成本会很夸张。

更好的流程是:提取音频——转成带时间戳的文字——AI 判断精华片段——输出时间戳——脚本裁剪拼接。脚本工具本身不是 AI,但很适合干这种事。你告诉它第5秒到第10秒剪出来,第20秒到第30秒拼进去,它就能干。

第三个坑是质量。比如Skill 里要写清楚:提取一个3分钟左右的切片;提取以后必须拼合好,不能一个个碎片扔给我;每次剪完以后,要告诉我为什么这么剪;不能为了完成任务而不顾质量;必须保证语义完整、逻辑完整。

这个“为什么”很重要。就像你找了个编导,剪完一个视频,不管好不好,都要问一句:你为什么剪成这样?所以视频切片最能体现模型和工具的分工:模型负责判断内容价值,脚本负责稳定执行动作。不要让模型硬扛所有任务,也不要让工具去做判断。

第五,CRM:把销售口述结构化成客户字段。

CRM是我觉得最能体现 Agent 价值的场景之一。很多企业没有预算上一套完整 CRM,但多维表格已经足够支撑大多数中小团队的客户管理需求。关键不在于“自然语言操作表格”,而在于一线员工不需要复杂系统培训,也能把业务事实写进系统。

打开网易新闻 查看精彩图片

比如我直接告诉 AI:你现在帮我分析一下我名下的客户,看看哪个成交率更大。它会去读多维表格里的数据,然后判断客户价值、赢单概率、丢单风险,并给出优先跟进建议。然后我再告诉它:帮我新增一个客户商机,金融行业,公司名叫 **公司,最近报价 30 万,把这条记录加进去。它会先确认,确认后直接写入表格。

这里最有价值的地方是:销售不需要搞清楚字段逻辑,只需要用自然语言说清楚业务事实。系统负责把它翻译成字段:

- 客户名称;

- 行业;

- 预算;

- 项目阶段;

- 最近沟通;

- 预计金额;

- 成交概率;

- 跟进人;

- 下一步动作。

字段一旦结构化,后面才能接客户优先级分析、商机新增、跟进提醒、权限确认。当然,权限是前提。你要让 AI 操作飞书、钉钉、企微里的表格,就要给它相应授权。我们在飞书对接时,是新建一个应用,基于这个应用开放不同权限,再告诉它能帮我干什么。没有权限,它想改也改不了。

打开网易新闻 查看精彩图片

更高级的动作,是能力组合。我会直接告诉它:分析我的客户画像,结合当前 AI 领域的热点,帮我推荐几个适合做自媒体的选题。它给我推荐制造业相关选题,理由是我正在跟进的客户里有多个制造业客户;也推荐电商相关选题,理由是客户里电商占比最高。

CRM 数据是一个基础能力,热点分析是一个基础能力。两个能力组合起来,就形成了一个业务级方案。所以一定要基于真实客户画像做内容选题,而不是拍脑袋选题。

打开网易新闻 查看精彩图片

如果再往前走,有了选题,能不能生成图?生成图之后,能不能直接发布?这就是基础能力的继续叠加。每往前组合一步,价值就乘一次。

最后,Agent 的核心,是让判断进入系统。

打开网易新闻 查看精彩图片

这就是我理解的 AI Agent 的核心逻辑:一个数据源,加上一套基于业务逻辑的 Skill 组合,就能形成一个真正有价值的解决方案。模型当然有影响,但核心还是两件事:第一,你的数据源能不能打通。第二,你的业务逻辑能不能用 Skill 稳定表达出来。

最后,我想说,从委托阶梯到记忆分层,从 Skill 的优先级到触发条件,从通道的生态选择到视频切片的 token 优化,再到 CRM 的权限配置,每一个点背后都有逻辑。在这个过程中,AI 不会替代你的判断、选择和创造。但它能让你的判断更快落地,让你的选择有更多数据支撑,让你的创造有更低执行门槛。

未来真正学会用 AI 的人,不是更懂技术的人,也不是最早用上工具的人,而是那些用AI开始做真正属于人的事情的人——判断、选择、创造。

PS:

见实会员最新游学活动来了:

我们将一起前往孩子王、奥特莱斯、秋水伊人、优比熊、周大生、千百度、JOYMARK等企业游学,还有一场「小红书增长」主题私享会,欢迎下方加入见实会员一起。

↘更多私域服务对接: