真正跑进业务的 Agent，不能每次都从零开始|agent|上下文|元数据|工作流|数据源|自然语言|调用

见实最近和很多人聊 Agent，发现大家对它的看法正在明显分化。

一派觉得它已经很好用，不只是每天在用，甚至开始往公司业务里落地；另一派则觉得它泡沫很大，很多场景没有想象中成熟，装上以后也未必比 GPT、DeepSeek 更顺手。

这两种感受都很真实。因为 Agent 的关键，已经不只是“能不能回答好一个问题”，而是能不能稳定地拆解业务、调用工具、衔接工作流，并在下一次任务里继续复用之前沉淀下来的经验。

前段时间，龙虾的爆火进一步放大了这个趋势：AI 正在从“对话式”走向“员工式”。过去几年，AI 的重点是变得更会想、更会答；接下来更大的变化，是我们开始教 AI 去行动。

但行动意味着复杂性。聊天型 AI 只要回答得好就行，Agent 却要处理记忆、Skill、工具、权限、表格、知识库和工作流。它能不能稳定，不只取决于模型能力，也取决于人的经验有没有被系统接住。

在见实前段时间的AI主题私享会上，铭文鼎成科技创始人陈一铭把这个逻辑拆得很细：Agent 如何从一次性的对话能力，变成可以反复调用的系统能力？

本文即为这次分享的精华实录（保留了第一人称）。，欢迎加入会员一起。

铭文鼎成科技创始人陈一铭

01Agent 真正稳定起来，是从经验离开聊天窗口开始的

很多时候，Agent 不是不会做，而是它每次都在重新理解你。

前面聊得好好的，规则说了，偏好讲了，流程也调顺了。但一换窗口，或者上下文一长，它突然就开始跑偏。我前期也被这个坑过。后来发现，问题不一定在模型，而是我们总会习惯性忽视模型的上下文调用问题。

比如你用 OpenClaw 和它磨出一套客户分析逻辑：先看行业，再看预算、项目阶段、最近沟通记录，最后判断客户应该优先跟进，还是暂时观察。这套逻辑如果只停在当前对话里，就是一次性的。今天有用，明天换个窗口，又要重新解释。

所以真正要解决的，不是让 Agent “记得更多”，而是判断：这条信息以后还该不该被调用？如果要被调用，它应该停在哪一层？

我一般把记忆分成四层：

首先是身份规则层。这一层最稳定。它是谁，服务谁，价值观是什么，会影响它面对任务时的基本判断。比如我自己的文档里，会写清楚：我是谁、做什么、喜欢什么风格、不喜欢废话、喜欢把问题搞清楚。

这些内容本质上是在控制模型：它处理事情时，到底能看到什么。这也对应 OpenClaw 这类 Agent 很重要的哲学：一切皆文本。大模型本身是黑盒，你很难直接控制它怎么想，但你可以控制它看什么。身份设定、行为准则、任务说明、项目背景，都是写给模型看的上下文。

所以后端那些 markdown 文档不是装饰，而是 Agent 的“可编辑记忆”。你直接在后台改文档，它后面理解任务的方式就会跟着变。因此，Agent 的核心能力，不只是模型能力，而是上下文管控能力。

第二，Skill 层：反复出现的流程，要变成可调用能力。Skill 层最大的特点是动态调度。你需要它的时候，它就上；不需要的时候，它就走。比如客户优先级分析、邮件分类、日报生成、视频切片、内容选题、CRM 商机新增，都不应该每次靠临时对话重新解释，而应该把当前窗口里已经跑通的逻辑上提为 Skill。这也是处理上下文截断的一个小技巧。

比如指令可以说：

>把这套客户分析逻辑封装成一个 Skill，触发条件是我说“分析客户优先级”；输入包括行业、预算、阶段、最近沟通记录；输出包括优先级、判断理由、下一步动作。

这样它就不再只是一次对话里的临时能力，而是后面可以反复调用的能力，这也是最近很火的Hermes的突出优势。

第三，长期记忆层，适合存你的名字、表达偏好、常用工具、关注客户、关键项目、长期有效的业务规则，但也要注意不能当成垃圾桶。如果把一次性的临时判断写进去，后面可能会误用。比如某个客户这次预算紧张，只是当前阶段情况；如果被当成长期标签，后面所有分析都默认这个客户预算紧张，就会污染判断。

第四，临时会话层，最灵活，也最不稳定。比如这篇文章怎么改、这次会议讨论了什么、某个临时判断、只对当前任务有效的限制条件，都可以留在会话里。但它不适合承担长期能力。

所以我的判断标准很简单：

只对当前任务有效的信息，留在会话里；

反复出现的偏好和背景，进入长期记忆；

已经跑通的处理流程，封装成 Skill；

需要协作和追踪的结果，进入表格、知识库或业务系统。

接下来必须要提及渠道会话，也会影响记忆调用。它不是简单的聊天入口，背后还有配对码、白名单、防干扰等机制，它决定的是生态位、权限和记忆加载方式。

比如大家可能遇到过这样的问题，你在群组里@一个智能体，让它调用记忆里存过的数据，结果它答不上来，不一定是它没记住，而是当前通道没有加载那部分 memory 文档。所以记忆调度会落到这些具体问题上：

- 当前信息要不要进入长期记忆；

- 当前流程要不要封装成 Skill；

- 当前通道有没有权限；

- 群组里有没有加载对应记忆；

- 白名单和配对有没有完成；

- 当前任务该不该读取某个项目文档。

这些问题想清楚了，Agent 才不会每次都重新理解你。

02Skill 再完整，触发条件模糊，就等于半失效

如果说记忆解决的是“信息应该放在哪里”，Skill 解决的就是“任务来了以后，能力怎么被调用”。

很多人把 Skill 理解成一句提示词，比如“帮我分析客户”“帮我剪视频”“帮我写日报”，这不够。真正能稳定运行的 Skill，不是一句话，而是一个包括元数据、脚本和资源模板的技能包。它至少要讲清楚：

- 适用场景；

- 触发条件；

- 输入字段；

- 执行步骤；

- 调用工具；

- 输出格式；

- 质量约束；

- 异常反馈。

这里最容易被忽略的是触发条件。比如一个 Skill 叫“客户处理”，就太泛了。它到底是新增客户、分析客户、生成客户日报，还是提醒销售跟进？Agent 不一定能判断。但如果写成“客户优先级分析”，适用场景是“当用户要求判断客户成交概率、跟进顺序或丢单风险时使用”，就明确很多。

任务进来后，Agent 不会先把所有 Skill 全部读完。它会先看 Skill 的标题、摘要、描述这些元数据，再决定是否加载脚本、文档和素材。这就是渐进披露。所以 Skill 的标题、摘要、触发条件，不是装饰，而是调用判断依据。

还有一个容易搞错的地方：覆盖面最广的 Skill，不一定优先级最高。项目级 Skill 的优先级往往最高，但只在当前项目里生效；全局 Skill 覆盖面更广，但优先级在中间；默认层最低。如果不同层放了同名 Skill，最后执行的往往是更高优先级那一个。

所以有时你明明配了 Skill，结果它不执行，不一定是没配好，也可能是被覆盖了。这时候要么换名字，要么换一层配置逻辑。

现在封装 Skill 的门槛已经低很多，很多时候一句话就能开始：

> 现在想做一件事，你把这件事变成一套执行逻辑，再把这套逻辑写进文档，存到记忆库里。

当然，做出来不等于做好，我会建议加一些辅助要求：

> 每次运行完，告诉我本次任务执行时长。

如果一个任务平时 30 秒做完，另一个任务跑了 10 分钟，那肯定有问题。下一步就该追问：

> 你为什么执行了 10 分钟？你的执行逻辑是什么？

总之，Skill 的优化，是从基础版，到复合版，再到长期可复用版，一层层磨出来的。

03AI工作流落地的关键，是把判断交给模型，把动作交给工具

前面讲的会话层、记忆层、Skill，最后都要落到工作流里。Agent 真正进入业务，不是因为它能聊，而是因为它能把判断结果交给系统继续执行。

关键是分工：模型负责理解、判断、排序、筛选；工具负责写入、裁剪、提醒、发布、同步；表格和知识库负责承接结构化结果；权限系统负责控制边界。

下面这些案例，表面上是个人助理、信息流、内容生产、视频切片、CRM，底层都是同一件事：把人的任务结构化到系统能继续执行的位置上。

第一，日程和邮箱：把高频切换结构化成固定流程。

个人助理真正比的不是快慢，而是：这个事到底还要不要我干。日程和邮箱很适合先做，因为它们不复杂，但高频打断。以前排日程，你要打开日历或 OA，填写时间、地点、提醒方式。现在只要语音说“帮我登记今天几点干什么”，它就能规划并提醒。

邮箱也是一样。订阅信息、项目邮件、邀约、询盘，可以先让 Agent 分成重要、一般、大项目相关、待处理几类。这里真正省掉的，不是几分钟操作，而是反复切换注意力的小判断。

第二，信息流：把资讯结构化进知识库和业务字段。

现在 AI 更新太快，有些团队还特别喜欢半夜发。你晚上 12 点准备睡了，它突然发一个新模型，你就不用睡了，得起来测、起来看，所以要先保住自己的注意力。

可以让 Agent 做信源整理和日报提醒。比如设定关心的热点：AI 领域，国内看阿里、腾讯，国外看 OpenAI、谷歌，看看他们最近发了什么模型、什么框架。提醒频率可以是每天早上、中午各一次，也可以是一周一次。

方式有两种：一种是自己上网扒拉，另一种是通过接口拿数据。像 Twitter、YouTube 这些平台，都有相应接口，可以直接抓热点，再判断是否纳入信息流。但信息流不能只停在“总结一下”。真正有价值的是，它能不能进入知识库和业务字段。

比如一个制造业 AI 质检案例，如果只是收藏，后面很难被调用。但如果进入表格，字段写清楚：行业、场景、痛点、解决方案、适合客户、销售话术、可转化选题，它后面就能和 CRM 里的制造业客户发生关系。

我自己的做法是：既然已经绑定飞书，就直接在飞书生态里解决。信息源、数据、文章扔进去，它会先帮我更新成云文档，再自动进入项目目录。

这里调用的是一整套权限：云文档权限、知识库权限、多维表格权限。底层逻辑就是：先筛选，再结构化，再沉淀到系统里。只有这样，信息后面才有机会参与内容选题、客户沟通、项目复盘。

第三，内容生产：把热点结构化成多维表架构。

从个人助理再往外走，就是公域内容。公域本质上拼三件事：发布频率、内容质量、渠道覆盖。以前这件事可能要专门配一个团队。现在一个 Agent 已经能承担其中相当一部分。但前提是，你不能只让它“写一篇”。

比如我让它分析全网热点、邮箱订阅信源，再检索最近一周 AI 方向适合我做自媒体的话题，然后把结果存进一个自媒体文档。这个时候关键能力是多维表格。前面抓信源、抓热点，是一层。存完以后，它还能在多维表格里生成字段，比如选题、核心观点、目标人群、适合平台、参考素材、AI 提示词、配图提示词、发布状态、数据反馈。

因此可以说，内容生产的自动化上限，取决于多维表架构。字段一旦清楚，公众号版本、小红书版本、视频版本，都可以继续往下接。原来只是“热点收集”，一旦进入多维表格，就可能变成完整内容矩阵的起点。

因此，真正重要的不是 AI 会不会写稿，而是热点进入系统以后，多维表格能不能继续接流程、接字段、接自动化。如果某个字段触发条件成立后，能自动提醒、自动推送，甚至进入多平台分发；发完以后，数据还能再拉回来继续分析，那系统办公就打通成了一个闭环。

第四，视频切片：把视频先转化为带时间戳的文本。

视频切片最开始看起来很简单：发一个 5 分钟视频，让它提炼成 3 分钟左右的精彩切片。但真正难的不是能不能切，而是怎么切得合理、便宜、稳定。

第一个坑是存储。素材太大，本地和服务器都不适合长期扛，所以最好放企业网盘，比如阿里云企业网盘，用共享链接进入流程。这样可控，不占本地和服务器空间，分享也方便。

第二个坑是 token。不要把整段视频直接交给大模型理解。原理没错，但 token 扛不住。如果 5 分钟视频都这么跑，一百个视频跑完，成本会很夸张。

更好的流程是：提取音频——转成带时间戳的文字——AI 判断精华片段——输出时间戳——脚本裁剪拼接。脚本工具本身不是 AI，但很适合干这种事。你告诉它第5秒到第10秒剪出来，第20秒到第30秒拼进去，它就能干。

第三个坑是质量。比如Skill 里要写清楚：提取一个3分钟左右的切片；提取以后必须拼合好，不能一个个碎片扔给我;每次剪完以后，要告诉我为什么这么剪;不能为了完成任务而不顾质量；必须保证语义完整、逻辑完整。

这个“为什么”很重要。就像你找了个编导，剪完一个视频，不管好不好，都要问一句：你为什么剪成这样？所以视频切片最能体现模型和工具的分工：模型负责判断内容价值，脚本负责稳定执行动作。不要让模型硬扛所有任务，也不要让工具去做判断。

第五，CRM：把销售口述结构化成客户字段。

CRM是我觉得最能体现 Agent 价值的场景之一。很多企业没有预算上一套完整 CRM，但多维表格已经足够支撑大多数中小团队的客户管理需求。关键不在于“自然语言操作表格”，而在于一线员工不需要复杂系统培训，也能把业务事实写进系统。

比如我直接告诉 AI：你现在帮我分析一下我名下的客户，看看哪个成交率更大。它会去读多维表格里的数据，然后判断客户价值、赢单概率、丢单风险，并给出优先跟进建议。然后我再告诉它：帮我新增一个客户商机，金融行业，公司名叫 **公司，最近报价 30 万，把这条记录加进去。它会先确认，确认后直接写入表格。

这里最有价值的地方是：销售不需要搞清楚字段逻辑，只需要用自然语言说清楚业务事实。系统负责把它翻译成字段：

- 客户名称；

- 行业；

- 预算；

- 项目阶段；

- 最近沟通；

- 预计金额；

- 成交概率；

- 跟进人；

- 下一步动作。

字段一旦结构化，后面才能接客户优先级分析、商机新增、跟进提醒、权限确认。当然，权限是前提。你要让 AI 操作飞书、钉钉、企微里的表格，就要给它相应授权。我们在飞书对接时，是新建一个应用，基于这个应用开放不同权限，再告诉它能帮我干什么。没有权限，它想改也改不了。

更高级的动作，是能力组合。我会直接告诉它：分析我的客户画像，结合当前 AI 领域的热点，帮我推荐几个适合做自媒体的选题。它给我推荐制造业相关选题，理由是我正在跟进的客户里有多个制造业客户；也推荐电商相关选题，理由是客户里电商占比最高。

CRM 数据是一个基础能力，热点分析是一个基础能力。两个能力组合起来，就形成了一个业务级方案。所以一定要基于真实客户画像做内容选题，而不是拍脑袋选题。

如果再往前走，有了选题，能不能生成图？生成图之后，能不能直接发布？这就是基础能力的继续叠加。每往前组合一步，价值就乘一次。

最后，Agent 的核心，是让判断进入系统。

这就是我理解的 AI Agent 的核心逻辑：一个数据源，加上一套基于业务逻辑的 Skill 组合，就能形成一个真正有价值的解决方案。模型当然有影响，但核心还是两件事：第一，你的数据源能不能打通。第二，你的业务逻辑能不能用 Skill 稳定表达出来。

最后，我想说，从委托阶梯到记忆分层，从 Skill 的优先级到触发条件，从通道的生态选择到视频切片的 token 优化，再到 CRM 的权限配置，每一个点背后都有逻辑。在这个过程中，AI 不会替代你的判断、选择和创造。但它能让你的判断更快落地，让你的选择有更多数据支撑，让你的创造有更低执行门槛。

未来真正学会用 AI 的人，不是更懂技术的人，也不是最早用上工具的人，而是那些用AI开始做真正属于人的事情的人——判断、选择、创造。

PS：

见实会员最新游学活动来了：。

我们将一起前往孩子王、奥特莱斯、秋水伊人、优比熊、周大生、千百度、JOYMARK等企业游学，还有一场「小红书增长」主题私享会，欢迎下方加入见实会员一起。

↘更多私域服务对接：