Claude新指令让“自主智能”不再空洞|claude|代码|大模型|自主智能

打开终端，输入“/goal”，然后告诉Claude Code：把那个早就想修的身份认证模块修好，所有测试必须通过，零代码风格警告。说完就去冲了杯咖啡，回来后发现它还在自己跑测试——一次失败，修正，再跑；又一次失败，再修正。没有对话，没有“下一步该做什么”的追问，直到终端里只剩一片绿色。

这一瞬间，才觉得“agentic”——“自主行动”这个词，第一次用对了地方。过去一年多，AI公司把它塞进各种产品描述里，从代码助手到聊天机器人，仿佛加上这个词就能显得更聪明。实际上，大部分工具只是把大模型嵌进命令行或编辑器，你仍然要一步步告诉它该做什么，和聊天窗口里复制粘贴的感觉差不了太多。Claude Code 刚出来时也是这样：能在终端里对话，能直接改文件，比对着网页手动搬运强一些，但要说“自主”，实在勉强。

直到/ goal命令出现，体验才发生了本质变化。

从使用方式上看，以前的模式是人与AI持续对话，每一次提示都要校准方向，生怕它跑偏。而/ goal把这种循环颠倒了过来：用户只需要定义一个明确的终点，剩下的步骤由Claude自行决定和推进。它会一直工作，直到满足结束条件，如果没达到就继续尝试，不会再问“接下来呢”。作者用这份“甩手掌柜”式的体验做了对比——不用反复检视进度，不用半路介入修正，等它自己来报告“做完了”，而且结果确实可用。

这种转变的关键，并不只是让模型多跑了几圈。拆解背后的机制，才能理解为什么它和过去的“自动完成”不一样。/goal 实际运行在一个评估循环里：每完成一轮工作，都有一个独立模型充当裁判，对照用户设定的标准判断目标是否达成。如果没达成，它会给 Claude一个简短的原因，指出哪些条件还没满足，然后循环继续；如果判定达成，就交还控制权。用作者的话说，不让 Claude 给自己的作业打分，是这个设计里维持“诚实”的重要一环。

修复Node.js认证模块的例子正好能说明这个循环的价值。作者设定的目标非常具体：npm test 全部通过，npm run lint 零错误零警告。这两个命令天然具备可测试性——要么过，要么不过，没有模棱两可的空间。Claude 随后开始写代码、运行测试，发现失败就对照错误信息修改，再测试。在这个过程中，评估模型能直接根据命令输出判断状态，不需要理解代码逻辑，只需要看有没有报错。于是 Claude 就能持续纠正自己，直到终端里的测试结果全部变绿。

这里也引出一个容易被忽视的前提：/goal 的效果严重依赖目标的清晰度。如果只是丢给它一句“把代码改好”，评估模型也判断不了什么叫“好”，循环很容易变成空转，或者产出一些形式上调整、实质无用的修改。作者的建议相当务实——花几分钟想清楚一个可以被自动检验的标准，远比匆忙尝试重要。配合清晰的 CLAUDE.md 说明和自动模式，才能让这个循环真正产出可靠的结果。

过去很多人把 Claude Code 当代码生成器用，结果发现它只是另一个需要频繁指令的助手。当作者改变用法，把它用来理解项目结构、理清终端里的混乱时，反而发现了它的另一层效用。而/ goal的加入，进一步把这种“理解力”转化为持续的、有目标导向的行动链。从设定终点，到脱离引导，再到自动纠错，这才让“自主”不再是一种说辞，而是一段看得见的过程。