最近看了飞天闪客的视频,他用一种非常接地气的方式,把那些听起来高大上的 AI 名词拆解开了。如果你也被 LLM、Agent、MCP、RAG 搞晕了,看这一篇就够了。
我们先来一波祛魅:
1. Skill并没有那么高大上,它只是固定了Prompt,换了个地方存储而已,算不上什么新技术。
2. 最近爆火的OpenClaw,它只是能自主干活,还没有所谓的技术大幅突破,核心还是依赖Agent、Skill等旧概念。
3. Agent听起来很科幻,本质就是个“传话筒”,专门处理大模型不会、不需要智能就能完成的活儿。
4. Function Calling和MCP看似高深,其实就是“约定”——一个约定Agent和大模型怎么聊,一个约定Agent和工具怎么连。
5. 所有AI新概念,说到底都是围绕Prompt做文章,要么帮着加上下文,要么帮着减少和大模型的沟通次数。
6. MCP和Workflow都比较鸡肋,MCP未来会被内化到Agent主程序,Workflow既不如编程框架适配程序员,也不如Skill适配普通人,迟早会被淘汰。
1. 基础概念:大模型与对话
LLM(大语言模型):本质上是只会做“文字接龙”的超级员工。
Prompt(提示词):你给员工下达的任务指令。
Context(上下文):沟通时的背景信息。
Memory(记忆):因为大模型记不住之前的对话,所以每次沟通前,把之前的聊天历史全塞进 Context 里,伪装成它有记忆。
2. 进阶能力:Agent 与检索
Agent(智能体):给大模型配一个“代理程序”。大模型负责思考,程序负责跑腿(上网、查资料、操作软件)。
RAG(检索增强生成):相当于给大模型一本参考书。通过向量数据库把相关的本地文档找出来,塞进上下文,解决大模型胡说八道的问题。
3. 连接协议:它们是怎么“沟通”的?
这是最容易混淆的部分,博主给出了非常清晰的定义:
Function Calling(函数调用):
【模型 ↔ Agent】 之间的约定。让模型按固定格式(如 JSON)说话,方便程序解析。
MCP(模型上下文协议):
【Agent ↔ 工具服务】之间的约定。像是一套标准接口文档,规定 Agent 怎么去调用各种外部工具。
4. 任务流:从“刚性”到“柔性”
为了完成复杂任务,行业内有几种不同的实现方式,它们的区别在于稳定性与灵活性的平衡:
模式 实现方式 特点 LangChain 纯代码编程 最稳定。流程硬编码,但缺乏灵活性。 Workflow 低代码拖拽 较稳定。图形化操作,适合简单的固定流程。 Skill(技能) 文档 + 脚本 平衡点。把提示词和脚本固化下来,按需加载。 Pure Agent 纯自主思考 最柔性。流程自己定,但最不可控,且费 Token。
什么是 Skill? > 飞天闪客认为 Skill 本质上是一个 Prompt 加载器。它把原本要写在提示词里的复杂要求和工具说明,换个地方存成了 .md 文件,需要时才读取。
四、OpenClaw又是啥
OpenClaw(ClawdBot) 本质是基于前面提到的Agent、Skill、Memory等核心名词,打造的“可直接落地、高易用性”的通用Agent产品,近期因“能自主干活”在GitHub爆火。
五、博主最后总结了一个看透所有新概念的统一视角:
本质都是“塞”: 所有的 Search、RAG、Skill,本质上都是在帮我们自动往 Prompt 里面增加上下文信息。
Agent 是“智能”的对立面: 一个流程中,所有能用固定程序(不需要动脑子)解决的部分,就是 Agent 发挥作用的地方。
趋势是“便利”: 未来的趋势不是去深究这些技术名词,而是会出现一个“超级 Agent”,把这些乱七八糟的配置全部内化掉。
小闲认为:
这恰恰体现了 AI 已经发展到了一个阶段。大模型基本上已经没有太多的技术突破,只能往应用层发展。那应用层怎么让普通人快速去了解?这是所有 AI 公司都在思考的问题。虽然说现在skill已经是简化了一定程序,Openclaw 也打出了个人助手的名头,但是对普通人来说依然有差距。我安装 Openclaw 都安装了好几个小时,什么时候这之间的鸿沟能够补齐,才是 AI 真正刺激需求的开始。
热门跟贴