Anthropic 工程师深度解读 Skills：AI Agent 的专业进化之路|agent|python|元数据|工作流|工程师|调用

最近刷屏Skills是什么，发布5周出现了数千个 Skills，他们有哪些类型，Skills为什么重新定义了 AI Agent 的开发方式，又有令人兴奋的应用场景？我们详细拆解了Claude Code 两位核心开发者的演讲视频（Stop building agents, build skills instead），带你一文读懂Skills如何让AI从"每次从头学"变成"越用越懂你"。

Barry Zhang 和 Mahesh Murag 是 Anthropic 的工程师，他们发现，如今许多人已经将 AI Agent 深度融入了日常工作。即便如此，差距依然存在，生成的回报里仍夹杂着不少低质内容。

问题的本质是：AI Agent 虽然聪明、有能力，但未必具备解决实际业务所需的专业经验。

举个例子，Mahesh 是智商 300 的数学天才，Barry 是经验丰富的税务专家，当你需要报税时，你会找谁？毫无疑问，我会选 Barry。我不希望 Mahesh 从第一性原理中推导出 2025 年的税法，我需要的是领域专家那种稳定、可靠的执行力。

这里可以做个类比：AI Agent = 智商 300 的 Mahesh，极其聪明，在深度引导下能做出惊人成绩，但在起步阶段往往缺乏关键的背景信息。

你想要的理想状态 = Barry：拥有领域专家的稳定、可靠执行力，无需从头推导就能给出专业答案。

想要达到理想状态，AI Agent 暴露出有三个缺陷：

无法高效吸收你的专业经验

无法随时间自我进化

起步阶段缺乏关键背景信息

这也是 Skills 诞生的原因。

在分享解决方案之前，Barry 和 Mahesh 先回顾了 Anthropic 内部的三个关键认知转变。这些认知是理解 Skills 设计的基础。

三大关键认知

认知 1："代码即一切"

过去的认知：

不同领域的 AI Agent 在架构上会大相径庭

需要各自的工具链和底层脚手架

每个用例、每个领域都要独立开发一个 AI Agent

在开发 Claude Code 后，团队意识到：

代码不仅是应用场景，更是通往数字世界的通用接口

底层 Agent 逻辑比预想中更具通用性

举个例子，生成一个财务报告，让我们看这个任务具体的任务分解：

调用 API 抓取数据

在文件系统整理资料

用 Python 分析数据

合成特定格式报告

底层仅需：Bash 环境 + 文件系统

结论：底层核心架构可以极其精简，但扩展性极强。

认知 2：文件是最佳协作单元

Skills 的本质：文件的有序集合（就是一个个文件夹）

Skills 是文件的有序集合，它为 AI Agent 打包了可组合的过程性知识。通俗点说，它们就是一个个文件夹。

为什么选择文件作为 Skills 的载体？为什么选择如此"原始"的形式？ Anthropic 团队有 3 大设计理念：

1. 普适性

任何拥有电脑的人都能创建和使用

开发者可以用

AI Agent 自己也可以用（这点很关键）

2. 兼容性

完美融入现有工作流：

用 Git 做版本控制

存在 Google Drive

打包分享给团队

3. 永恒性

几十年来，文件一直是最基础的协作单元，既然好用，为何要改变呢？选择文件作为载体，工具生态成熟，学习成本为零，迁移成本为零。

认知 3：代码胜过传统工具定义

这也是最关键的一个认知。

传统工具定义的四大缺陷：

指令含糊不清

无法自我修改：模型执行受阻时陷入"冷启动"困境

持续占用上下文：定义会一直占用上下文窗口空间

缺乏灵活性

相比之下，代码的三大优势：

自文档化：代码本身就是最好的说明

可随时修改：AI 可以自己优化工具

按需加载：平时存储在文件系统，仅在需要时调用

举个例子：Claude 经常重复编写相同的 Python 脚本来调整幻灯片样式，每次都要重新编写，浪费 tokens，质量不稳定。

现在给个解决方案：让 Claude 将这段脚本保存为一项 Skill，现在只需直接运行脚本即可，效率和一致性大幅提升将"重复劳动"转化为"可复用知识"。

Skills 系统架构设计

1. 核心组成

Skills 包含什么？

Markdown 文件（核心指令）

软件包

可执行文件和二进制文件

脚本

各类资产

复杂度演进：

初期：简单的 Markdown 文件（几分钟完成）

现在：综合体（需数周甚至数月精耕细作）

2. 逐步披露策略

当你拥有成百上千个 Skills 时，出现一个问题：如果全部加载到上下文窗口，会瞬间耗尽 tokens。因此，Anthropic 采用了一个逐步披露策略。

如何实现？运行时流程：

初始状态：模型只看到 Skills 元数据

需要使用时：AI Agent 读取 SKILL.md 文件

获取：核心指令 + 目录索引

效果是，即使拥有成千上万个 Skills，系统依然高效。

举个例子：假设一个 AI Agent 拥有 500 个 Skills，

初始状态：

Context window：仅包含 500 个 Skills 的元数据

占用空间：约 5-10K tokens

用户请求："帮我生成一份销售报告"

执行流程：

Agent 扫描元数据 → 识别出 "sales_reporting" Skill

加载 sales_reporting/SKILL.md → 读取核心指令和文件结构 → 占用空间：约 1-2K tokens

按需加载具体脚本 → 读取 generate_report.py → 读取 format_template.json → 执行完毕后从 context 中清除

这种设计的好处是支持成千上万个 Skills ，上下文窗口消耗始终可控，不需要的 Skills 不占用空间，可以动态组合多个 Skills ，支持复杂的工作流编排。

统一架构模型

经过一年的探索，Anthropic 观察到一个趋势：通用 AI Agent 的架构正趋于统一。

新兴通用 AI Agent 架构的四大组件：

Agent Loop：职责是大脑，理解用户意图、规划执行步骤、管理上下文窗口、决定何时调用哪些工具或 Skills。

运行时环境：执行环境，提供代码执行能力、管理文件系统、处理进程隔离和安全。

MCP：负责外部世界的物理连接，连接外部 API、访问数据库、调用第三方服务。

Skills：职责是知识与经验，提供灵魂（专业知识），包含领域专业知识、最佳实践、过程性经验等。

两者完美互补，形成完整生态。

Skills 生态三大类别

自发布以来，Skills 生态已经拥有数千项 Skills，主要分为 3 大类。

1. 基础 Skills

赋予 AI Agent 全新的通用能力或领域能力。

案例：

Document Skills：创作和编辑专业办公文档，支持 Word、PPT、Excel 等格式，理解文档结构和业务逻辑，让 Claude 具备创作和编辑专业办公文档的能力。

基础 Skills 扩展了模型的基础能力边界，就像为操作系统增加新的系统调用。

2. 第三方 Skills

让 Claude 更好地适配第三方产品和服务。

案例：

Cadence - 科学研究 Skills：使 Claude 在 EHR 数据分析上表现远超原生模型，熟练应用 Python 生物信息库。

Browserbase - Stagehand Skills：为开源浏览器自动化工具构建专属 Skills，让 Claude 更熟练地操控浏览器。

Notion - 工作空间 Skills：深度理解用户的 Notion 工作空间，进行跨文档研究。

3. 企业私有 Skills

最令人兴奋的应用场景，针对公司特定场景构建的 Skills。

典型用例：

传授组织最佳实践：将公司独特的工作方法编码为 Skills，让新来的 AI 立即理解公司文化，按规矩办事。

内部软件培训：教会 AI 如何使用公司特有工具，让 AI 像老员工一样熟悉内部系统。

代码规范遵循：让 Claude Code 遵循内部代码风格和工作流，代码一致性大幅提升。

Anthropic 的工程师观察到的三大趋势

趋势 1：非技术人员也在构建 Skills

来自以下领域的专业人士正在创建 Skills：有财务部门、招聘团队、会计师事务所、法律顾问。Skills 让 AI Agent 变得触手可及，即使不擅长编程也能让 AI 适配日常工作。

趋势 2：Skills 与 MCP 形成完美互补

开发者正在利用 Skills 编排多个 MCP 工具的工作流

分工明确：MCP 负责连接，专注于"能不能"，MCP 开发者不需要了解所有业务场景。Skills 负责智慧和业务逻辑，专注于"该不该"和"怎么做"，Skills 创建者不需要处理底层连接细节。

N 个 MCP Servers × M 个 Skills，灵活性远超单一工具。

趋势 3：Skills 日益复杂化

从简单 Markdown 到包含多种资产的综合体，开发周期从几分钟到数周/数月。为什么复杂化是好事？说明 Skills 开始承载真实业务逻辑，生态走向成熟。

Anthropic 内部应用成果

在分享中， Anthropic 工程师还介绍了公司内部的垂直领域落地案例。在 Skills 功能发布后，Anthropic 紧接着推出了两个专业方案：

金融服务专业方案

生命科学专业方案

实现方式：预装 MCP 服务器 + Skills 包 → Claude 立即成为领域专家助手。传统方式开发垂直领域 AI 需要 6-12 个月，Skills 方式配置垂直领域 AI 仅需数周。不只可以快速迭代和调整，Skills 还可以跨场景使用。

Skills 未来探索的四大方向

1. 软件工程化管理

需求：像对待软件一样对待 Skills

具体措施：

引入测试与评估机制

开发更好的触发工具（确保正确时间触发正确 Skills）

建立输出质量衡量标准

完善版本控制系统

2. Skills 依赖关系管理

目标：让 Skills 可以引用其他 Skills、MCP 服务器或环境包

价值：

AI Agent 在复杂环境下行为更可控、更精准

通过多 Skills 组合，激发处理高级任务的潜力

3. 共享与分发生态

愿景：企业内部拥有由员工与 AI 共同维护、不断进化的能力知识库

复利效应：企业内部能力知识库的不断进化。

4. 持续学习

核心突破：Skills 是迈向持续学习的具体步骤

记忆具象化：

过去：信息的堆砌

现在：针对特定任务的过程性知识

学习可能性：标准化格式保证：Claude 记录的任何经验都能被未来的自己高效继承。

灵活优势：随着合作时间增加，瞬间习得新能力，根据需求不断优化，果断舍弃过时操作。

终极目标

"与你共事 30 天后的 Claude，表现应当远优于第 1 天。"

当前进展：Claude 已可利用 Skill Creator 自动生成 Skills。

Skills 的定位

让每个人都能通过简单的文件夹，将创意与专业知识转化为解决现实问题的力量。

Anthropic 的工程师表示，Skills，只是这场变革的起点。Skills 系统，通过极简的文件格式，解决了 AI Agent 缺乏领域专业知识的核心痛点，并构建了一个开放、可组合、可进化的生态系统。AI 持续学习，让专业经验自由流动，让组织知识的永久沉淀。

真正的价值不在于构建更聪明的 AI，而在于让 AI 具备可复用、可积累、可共享的专业经验。这才是 AI Agent 走向实用的关键路径。

| 文章来源：数字开物

• END •

Anthropic 工程师深度解读 Skills：AI Agent 的专业进化之路

热搜

热门跟贴

热搜

热门跟贴

相关推荐

Anthropic掏出700块一个月的全能“AI同事”，直面微软Copilot

智能Agent如何改造传统工作流：从搜索到全能助手-青否AI Agent！

AI进化史：从基础工具到智能助手，带你读懂AI发展之路

AI工具深入老百姓生活，使用高科技更需要高智商

零基础科研逆袭！AI+Python 机器学习医疗数据分析实战营

首个AI同事正式「入编」！CES 2026超级组织引爆

中国创造一门新编程语言的黄金时代来了？

大模型最难的AI Infra，用Vibe Coding搞定

美团又上新模型，8个Thinker齐开工，能顶个诸葛亮？

Qwen超强模型+完整生态，阿里要打造中国AI龙头标的

00后团队夺得AI编程智能体榜SOTA榜首，一人公司时代开启

Agent时代，为什么多模态数据湖是必选项？

裁员50%后，他靠AI编程大逆袭！ARR破亿，估值直冲600亿

AI时代，重做ERP

35天，版本之子变路人甲：AI榜单太残酷！

AI时代的全球创作消费平台，出现了一家来自中国的“隐形冠军”

美团上线首个开源“重思考”模型

OpenAI偷袭，谷歌掀桌！2026开年第一场AI大战太精彩

参加完百度世界大会，我终于理解了「内化 AI」的正确打开方式

字节把云推上“火山口”