打开终端,输入“/goal”,然后告诉Claude Code:把那个早就想修的身份认证模块修好,所有测试必须通过,零代码风格警告。说完就去冲了杯咖啡,回来后发现它还在自己跑测试——一次失败,修正,再跑;又一次失败,再修正。没有对话,没有“下一步该做什么”的追问,直到终端里只剩一片绿色。
这一瞬间,才觉得“agentic”——“自主行动”这个词,第一次用对了地方。过去一年多,AI公司把它塞进各种产品描述里,从代码助手到聊天机器人,仿佛加上这个词就能显得更聪明。实际上,大部分工具只是把大模型嵌进命令行或编辑器,你仍然要一步步告诉它该做什么,和聊天窗口里复制粘贴的感觉差不了太多。Claude Code 刚出来时也是这样:能在终端里对话,能直接改文件,比对着网页手动搬运强一些,但要说“自主”,实在勉强。
直到/ goal命令出现,体验才发生了本质变化。
从使用方式上看,以前的模式是人与AI持续对话,每一次提示都要校准方向,生怕它跑偏。而/ goal把这种循环颠倒了过来:用户只需要定义一个明确的终点,剩下的步骤由Claude自行决定和推进。它会一直工作,直到满足结束条件,如果没达到就继续尝试,不会再问“接下来呢”。作者用这份“甩手掌柜”式的体验做了对比——不用反复检视进度,不用半路介入修正,等它自己来报告“做完了”,而且结果确实可用。
这种转变的关键,并不只是让模型多跑了几圈。拆解背后的机制,才能理解为什么它和过去的“自动完成”不一样。/goal 实际运行在一个评估循环里:每完成一轮工作,都有一个独立模型充当裁判,对照用户设定的标准判断目标是否达成。如果没达成,它会给 Claude一个简短的原因,指出哪些条件还没满足,然后循环继续;如果判定达成,就交还控制权。用作者的话说,不让 Claude 给自己的作业打分,是这个设计里维持“诚实”的重要一环。
修复Node.js认证模块的例子正好能说明这个循环的价值。作者设定的目标非常具体:npm test 全部通过,npm run lint 零错误零警告。这两个命令天然具备可测试性——要么过,要么不过,没有模棱两可的空间。Claude 随后开始写代码、运行测试,发现失败就对照错误信息修改,再测试。在这个过程中,评估模型能直接根据命令输出判断状态,不需要理解代码逻辑,只需要看有没有报错。于是 Claude 就能持续纠正自己,直到终端里的测试结果全部变绿。
这里也引出一个容易被忽视的前提:/goal 的效果严重依赖目标的清晰度。如果只是丢给它一句“把代码改好”,评估模型也判断不了什么叫“好”,循环很容易变成空转,或者产出一些形式上调整、实质无用的修改。作者的建议相当务实——花几分钟想清楚一个可以被自动检验的标准,远比匆忙尝试重要。配合清晰的 CLAUDE.md 说明和自动模式,才能让这个循环真正产出可靠的结果。
过去很多人把 Claude Code 当代码生成器用,结果发现它只是另一个需要频繁指令的助手。当作者改变用法,把它用来理解项目结构、理清终端里的混乱时,反而发现了它的另一层效用。而/ goal的加入,进一步把这种“理解力”转化为持续的、有目标导向的行动链。从设定终点,到脱离引导,再到自动纠错,这才让“自主”不再是一种说辞,而是一段看得见的过程。
热门跟贴