打开网易新闻 查看精彩图片

最近刷屏Skills是什么,发布5周出现了数千个 Skills,他们有哪些类型,Skills为什么重新定义了 AI Agent 的开发方式,又有令人兴奋的应用场景?我们详细拆解了Claude Code 两位核心开发者的演讲视频(Stop building agents, build skills instead),带你一文读懂Skills如何让AI从"每次从头学"变成"越用越懂你"。

打开网易新闻 查看精彩图片

Barry Zhang 和 Mahesh Murag 是 Anthropic 的工程师,他们发现,如今许多人已经将 AI Agent 深度融入了日常工作。即便如此,差距依然存在,生成的回报里仍夹杂着不少低质内容。

问题的本质是:AI Agent 虽然聪明、有能力,但未必具备解决实际业务所需的专业经验。

举个例子,Mahesh 是智商 300 的数学天才,Barry 是经验丰富的税务专家,当你需要报税时,你会找谁?毫无疑问,我会选 Barry。我不希望 Mahesh 从第一性原理中推导出 2025 年的税法,我需要的是领域专家那种稳定、可靠的执行力。

这里可以做个类比:AI Agent = 智商 300 的 Mahesh,极其聪明,在深度引导下能做出惊人成绩,但在起步阶段往往缺乏关键的背景信息。

你想要的理想状态 = Barry:拥有领域专家的稳定、可靠执行力,无需从头推导就能给出专业答案。

想要达到理想状态,AI Agent 暴露出有三个缺陷:

无法高效吸收你的专业经验

无法随时间自我进化

起步阶段缺乏关键背景信息

这也是 Skills 诞生的原因。

在分享解决方案之前,Barry 和 Mahesh 先回顾了 Anthropic 内部的三个关键认知转变。这些认知是理解 Skills 设计的基础。

三大关键认知

认知 1:"代码即一切"

过去的认知:

不同领域的 AI Agent 在架构上会大相径庭

需要各自的工具链和底层脚手架

每个用例、每个领域都要独立开发一个 AI Agent

在开发 Claude Code 后,团队意识到:

代码不仅是应用场景,更是通往数字世界的通用接口

底层 Agent 逻辑比预想中更具通用性

举个例子,生成一个财务报告,让我们看这个任务具体的任务分解:

调用 API 抓取数据

在文件系统整理资料

用 Python 分析数据

合成特定格式报告

底层仅需:Bash 环境 + 文件系统

结论:底层核心架构可以极其精简,但扩展性极强。

认知 2:文件是最佳协作单元

Skills 的本质:文件的有序集合(就是一个个文件夹)

Skills 是文件的有序集合,它为 AI Agent 打包了可组合的过程性知识。通俗点说,它们就是一个个文件夹。

为什么选择文件作为 Skills 的载体?为什么选择如此"原始"的形式? Anthropic 团队有 3 大设计理念:

1. 普适性

任何拥有电脑的人都能创建和使用

开发者可以用

AI Agent 自己也可以用(这点很关键)

2. 兼容性

完美融入现有工作流:

用 Git 做版本控制

存在 Google Drive

打包分享给团队

3. 永恒性

几十年来,文件一直是最基础的协作单元,既然好用,为何要改变呢?选择文件作为载体,工具生态成熟,学习成本为零,迁移成本为零。

认知 3:代码胜过传统工具定义

这也是最关键的一个认知。

传统工具定义的四大缺陷:

指令含糊不清

无法自我修改:模型执行受阻时陷入"冷启动"困境

持续占用上下文:定义会一直占用上下文窗口空间

缺乏灵活性

相比之下,代码的三大优势:

自文档化:代码本身就是最好的说明

可随时修改:AI 可以自己优化工具

按需加载:平时存储在文件系统,仅在需要时调用

举个例子:Claude 经常重复编写相同的 Python 脚本来调整幻灯片样式,每次都要重新编写,浪费 tokens,质量不稳定。

现在给个解决方案:让 Claude 将这段脚本保存为一项 Skill,现在只需直接运行脚本即可,效率和一致性大幅提升将"重复劳动"转化为"可复用知识"。

Skills 系统架构设计

1. 核心组成

Skills 包含什么?

Markdown 文件(核心指令)

软件包

可执行文件和二进制文件

脚本

各类资产

复杂度演进:

初期:简单的 Markdown 文件(几分钟完成)

现在:综合体(需数周甚至数月精耕细作)

打开网易新闻 查看精彩图片

2. 逐步披露策略

当你拥有成百上千个 Skills 时,出现一个问题:如果全部加载到上下文窗口,会瞬间耗尽 tokens。因此,Anthropic 采用了一个逐步披露策略。

如何实现?运行时流程:

初始状态:模型只看到 Skills 元数据

需要使用时:AI Agent 读取 SKILL.md 文件

获取:核心指令 + 目录索引

效果是,即使拥有成千上万个 Skills,系统依然高效。

举个例子:假设一个 AI Agent 拥有 500 个 Skills,

初始状态:

Context window:仅包含 500 个 Skills 的元数据

占用空间:约 5-10K tokens

用户请求:"帮我生成一份销售报告"

执行流程:

Agent 扫描元数据 → 识别出 "sales_reporting" Skill

加载 sales_reporting/SKILL.md → 读取核心指令和文件结构 → 占用空间:约 1-2K tokens

按需加载具体脚本 → 读取 generate_report.py → 读取 format_template.json → 执行完毕后从 context 中清除

这种设计的好处是支持成千上万个 Skills ,上下文窗口消耗始终可控,不需要的 Skills 不占用空间 ,可以动态组合多个 Skills ,支持复杂的工作流编排。

打开网易新闻 查看精彩图片

统一架构模型

经过一年的探索,Anthropic 观察到一个趋势:通用 AI Agent 的架构正趋于统一。

新兴通用 AI Agent 架构的四大组件:

Agent Loop:职责是大脑,理解用户意图、规划执行步骤、管理上下文窗口、决定何时调用哪些工具或 Skills。

运行时环境:执行环境,提供代码执行能力、管理文件系统、处理进程隔离和安全。

MCP:负责外部世界的物理连接,连接外部 API、访问数据库、调用第三方服务。

Skills:职责是知识与经验,提供灵魂(专业知识),包含领域专业知识、最佳实践、过程性经验等。

两者完美互补,形成完整生态。

打开网易新闻 查看精彩图片

Skills 生态三大类别

自发布以来,Skills 生态已经拥有数千项 Skills,主要分为 3 大类。

1. 基础 Skills

赋予 AI Agent 全新的通用能力或领域能力。

案例:

Document Skills:创作和编辑专业办公文档,支持 Word、PPT、Excel 等格式,理解文档结构和业务逻辑,让 Claude 具备创作和编辑专业办公文档的能力。

基础 Skills 扩展了模型的基础能力边界,就像为操作系统增加新的系统调用。

2. 第三方 Skills

让 Claude 更好地适配第三方产品和服务。

案例:

Cadence - 科学研究 Skills:使 Claude 在 EHR 数据分析上表现远超原生模型,熟练应用 Python 生物信息库。

Browserbase - Stagehand Skills:为开源浏览器自动化工具构建专属 Skills,让 Claude 更熟练地操控浏览器。

Notion - 工作空间 Skills:深度理解用户的 Notion 工作空间,进行跨文档研究。

3. 企业私有 Skills

最令人兴奋的应用场景,针对公司特定场景构建的 Skills。

典型用例:

传授组织最佳实践:将公司独特的工作方法编码为 Skills,让新来的 AI 立即理解公司文化,按规矩办事。

内部软件培训:教会 AI 如何使用公司特有工具,让 AI 像老员工一样熟悉内部系统。

代码规范遵循:让 Claude Code 遵循内部代码风格和工作流,代码一致性大幅提升。

打开网易新闻 查看精彩图片

Anthropic 的工程师观察到的三大趋势

趋势 1:非技术人员也在构建 Skills

来自以下领域的专业人士正在创建 Skills:有财务部门、招聘团队、会计师事务所、法律顾问。Skills 让 AI Agent 变得触手可及,即使不擅长编程也能让 AI 适配日常工作。

趋势 2:Skills 与 MCP 形成完美互补

开发者正在利用 Skills 编排多个 MCP 工具的工作流

分工明确:MCP 负责连接,专注于"能不能",MCP 开发者不需要了解所有业务场景。Skills 负责智慧和业务逻辑,专注于"该不该"和"怎么做",Skills 创建者不需要处理底层连接细节。

N 个 MCP Servers × M 个 Skills,灵活性远超单一工具。

趋势 3:Skills 日益复杂化

从简单 Markdown 到包含多种资产的综合体,开发周期从几分钟到数周/数月。为什么复杂化是好事?说明 Skills 开始承载真实业务逻辑,生态走向成熟。

Anthropic 内部应用成果

在分享中, Anthropic 工程师还介绍了公司内部的垂直领域落地案例。在 Skills 功能发布后,Anthropic 紧接着推出了两个专业方案:

金融服务专业方案

生命科学专业方案

实现方式:预装 MCP 服务器 + Skills 包 → Claude 立即成为领域专家助手。传统方式开发垂直领域 AI 需要 6-12 个月,Skills 方式配置垂直领域 AI 仅需数周。不只可以快速迭代和调整,Skills 还可以跨场景使用。

Skills 未来探索的四大方向

1. 软件工程化管理

需求:像对待软件一样对待 Skills

具体措施:

引入测试与评估机制

开发更好的触发工具(确保正确时间触发正确 Skills)

建立输出质量衡量标准

完善版本控制系统

2. Skills 依赖关系管理

目标:让 Skills 可以引用其他 Skills、MCP 服务器或环境包

价值:

AI Agent 在复杂环境下行为更可控、更精准

通过多 Skills 组合,激发处理高级任务的潜力

3. 共享与分发生态

愿景:企业内部拥有由员工与 AI 共同维护、不断进化的能力知识库

复利效应:企业内部能力知识库的不断进化。

4. 持续学习

核心突破:Skills 是迈向持续学习的具体步骤

记忆具象化:

过去:信息的堆砌

现在:针对特定任务的过程性知识

学习可能性:标准化格式保证:Claude 记录的任何经验都能被未来的自己高效继承。

灵活优势:随着合作时间增加,瞬间习得新能力,根据需求不断优化,果断舍弃过时操作。

终极目标

"与你共事 30 天后的 Claude,表现应当远优于第 1 天。"

当前进展:Claude 已可利用 Skill Creator 自动生成 Skills。

Skills 的定位

让每个人都能通过简单的文件夹,将创意与专业知识转化为解决现实问题的力量。

Anthropic 的工程师表示,Skills,只是这场变革的起点。Skills 系统,通过极简的文件格式,解决了 AI Agent 缺乏领域专业知识的核心痛点,并构建了一个开放、可组合、可进化的生态系统。AI 持续学习,让专业经验自由流动,让组织知识的永久沉淀。

真正的价值不在于构建更聪明的 AI,而在于让 AI 具备可复用、可积累、可共享的专业经验。这才是 AI Agent 走向实用的关键路径。

| 文章来源:数字开物

• END