#探寻人工智能,人与AI全新序章#

这两天连续看 Claude Code 的更新,我越来越有一个感觉:AI 编程工具真正的分水岭,已经从“能不能把任务做完”,转到“做之前能不能把风险拦住”。

6 月 25 日,Claude Code 更新到 2.1.193。表面看只是一个小版本,更新项也没有那种特别炸裂的大功能。但里面有一个设置很值得单独拎出来讲:autoMode.classifyAllShell。

它的作用很直接:让所有 Bash / PowerShell 命令都先经过 auto mode classifier(自动模式分类器),过去主要盯那些看起来像“任意代码执行”的命令,现在可以把范围扩到所有 shell 命令。

这件事听着有点技术,其实特别贴近真实使用。你让 Claude Code 处理一个项目,它很可能会跑命令、装依赖、查日志、执行测试、调用脚本。命令一旦跑错,轻则浪费时间,重则改坏文件、泄露信息、碰到生产环境。

所以这篇不做更新日志翻译。我想讲清楚一个判断:Claude Code 现在开始把“AI 能不能跑这条命令”做成系统能力,减少用户全程盯着终端的压力。

打开网易新闻 查看精彩图片

先说结论:这是一个命令闸门

很多人第一次用 Claude Code,会先被它的执行能力吸引。它能读代码、改文件、跑测试、查报错,还能在你不盯着的时候继续处理一些任务。

但越是这种能干活的 Agent,越不能只看它“会不会做”。真正要看的还有另一个问题:它准备动手之前,有没有一道像样的闸门。

这次 2.1.193 的核心变化,就是把 shell 命令这条通道继续收紧。

过去 auto mode(自动模式)的思路,是尽量减少重复权限弹窗,让 Claude Code 在一段任务里更顺畅地执行,同时由分类器在后台判断危险动作。现在多了 autoMode.classifyAllShell,意味着你可以让所有 Bash / PowerShell 命令都进入同一个审查流程。

这就像从“重点查危险品”升级到“所有出门的人都过安检”。它会带来一点延迟,也可能出现误拦,但它换来的价值是:命令执行这件事开始有了更一致的审查口径。

打开网易新闻 查看精彩图片

跑命令前先过审,真正防的是这 4 类事故

很多朋友看到“所有命令都审查”,第一反应可能是:那 npm test、git status、python script.py 这种也要审吗?

这正是这次更新值得看的地方。

在本地项目里,有些命令表面看起来很普通,实际影响范围并不小。比如一个脚本可能会读取 .env,一个测试命令可能会连到外部服务,一个清理命令可能会删掉缓存目录,一个数据库迁移命令可能会改真实数据。

Claude Code 的官方权限文档里,auto mode 本来就会拦一些高风险动作,比如下载并执行代码、把敏感数据发到外部、生产部署、修改共享基础设施、强制推送、销毁云资源等。2.1.193 这次把“所有 shell 命令都能先过分类器”补上后,适合用来防这 4 类事故。

风险类型

真实场景

为什么要先审

误删误改

清理临时目录时带错路径,或者执行了危险的 git 命令

命令执行后可能很难回滚

误连外部

脚本自动请求接口、上传日志、连接远程服务

本地任务可能变成网络任务

误碰敏感信息

命令读取

.env、token、配置文件、密钥路径

Agent 未必知道哪些内容不能外流

误触生产动作

部署、迁移、销毁资源、改云端权限

一条命令可能影响真实系统

我建议把这个更新理解成一句话:以后让 Claude Code 跑命令,不要只问“它会不会跑”,还要问“这条命令有没有经过合适的风险判断”。

打开网易新闻 查看精彩图片

怎么开:先在测试项目里试这个设置

先确认自己的版本是否已经到 2.1.193 或更高。官方 changelog 也提醒,可以用下面的命令看当前安装版本。

claude --versioncode>

如果你已经在用 auto mode,可以先在一个不重要的测试项目里尝试打开 autoMode.classifyAllShell。最稳的做法是先从 Claude Code 内部的 /config 改单项配置开始。

/config autoMode.classifyAllShell=true

如果你习惯改配置文件,也可以检查自己的用户配置。用户级配置通常在这里:

~/.claude/settings.json

一种容易理解的写法是把它放到 autoMode 下面:

{"autoMode": {"classifyAllShell": true}

这里我建议先放用户级配置,不要一上来放到项目共享配置里。原因很简单:不同团队、不同项目、不同机器上的命令习惯不一样。你先在自己的环境里跑顺,再考虑要不要做团队规范。

另外,auto mode 本身对账户、模型、部署方式都有要求。你如果切不到 auto mode,或者看到组织策略限制,要先看账号、模型和管理员设置,不要反复改项目配置。

打开网易新闻 查看精彩图片

拒绝原因开始留痕,比“拦住”更重要

2.1.193 还有一个很实用的变化:auto mode denial reasons(自动模式拒绝原因)会出现在 transcript(会话记录)、拒绝提示,以及 /permissions 的最近拒绝里。

这个点特别重要。

以前最难受的情况,是 Claude Code 被拦住了,但你不知道到底哪里触发了风险。你只知道“没让跑”,却不知道是命令本身危险、路径超范围、涉及外部服务,还是上下文里你自己写过“不要部署”“不要推送”。

现在拒绝原因更容易回看,就方便做三件事。

第一,你能判断是否自己提示词写太宽。比如你让它“把部署问题也顺手处理一下”,分类器可能把后续命令理解成要碰生产动作。

第二,你能判断是否项目环境没说清楚。比如某个内部仓库、私有包源、测试服务器在你的团队里很正常,但分类器并不知道它是可信基础设施。

第三,你能把反复被拦的动作沉淀成规则。该加 deny 的加 deny,该加 trusted infrastructure 的找管理员配,该把任务拆小的就拆小。

实际排查时,可以去这里看最近拒绝:

/permissions

我的建议是:被拒绝不要急着强行批准,先看拒绝原因。它可能正在提醒你,这个任务边界没有说清楚。

打开网易新闻 查看精彩图片

日志边界也变了:升级后先看 OTEL 配置

这次更新还有一个容易被忽略的点:Claude Code 新增了 claude_code.assistant_response OpenTelemetry log event,用来记录模型响应文本。

官方说明里的关键细节是:这个内容默认会被保护,但如果你的部署已经在记录 prompt content,升级后可能会开始收到 response content。只想保留 prompts-only 的话,可以设置:

OTEL_LOG_ASSISTANT_RESPONSES=0

这个点对个人用户影响可能不大,但对公司环境、团队环境、远程开发机、统一日志平台就很关键。

原因很简单:模型回复里可能包含文件路径、错误栈、接口名、内部服务名、测试结果,甚至你让它分析过的片段。你以为只是在终端里看,实际日志系统也可能收到一份。

所以升级 2.1.193 之后,我会建议有团队环境的朋友顺手做一次检查。

echo $OTEL_LOG_USER_PROMPTSecho $OTEL_LOG_ASSISTANT_RESPONSES

如果你所在团队已经做了 OpenTelemetry 采集,最好明确三件事:采集什么、保存多久、谁能看。

打开网易新闻 查看精彩图片

命令审查之外,这一版还在补长期运行体验

如果只看标题,2.1.193 最值得讲的是跑命令前先过审。但完整 changelog 里还有几个点,放在一起看更有意思。

第一,bash mode(!)新增了 live file path autocomplete(实时文件路径自动补全)。这对经常在 Claude Code 里临时跑命令的人很实用,少打错路径,少复制粘贴。

第二,MCP 服务器需要认证时,启动时会提示,并指向 /mcp。这能减少一种常见困惑:明明配置了 MCP,Claude Code 却用不了工具,最后才发现是认证没过。

第三,MCP headersHelper 认证遇到 401 / 403 后,会自动重跑 helper 并重连。这个点适合企业环境和私有工具链,token 过期、权限刷新这类问题会少一些卡顿。

第四,后台 shell 命令在内存压力下会自动回收闲置任务。很多人现在把 Claude Code 当长会话工作台用,后台任务一多,稳定性就很重要。

把这些点合在一起看,2.1.193 的方向很清楚:一边增强“能跑”,一边补“别乱跑、跑完可追踪、跑久别拖垮机器”。

打开网易新闻 查看精彩图片

哪些场景最适合打开这个开关

我不建议所有人看到新设置就马上打开,然后直接丢给真实项目。更稳的方式是按场景来。

场景

建议

原因

本地小项目、测试仓库

可以先开

命令多,风险低,适合熟悉拦截逻辑

带真实密钥的项目

建议先开,但同时补 deny 规则

命令审查有帮助,密钥边界还要单独收紧

公司代码库

先问团队规范

日志、权限、MCP、审计都可能有统一要求

生产部署脚本

不要交给 auto mode 放手跑

高风险动作必须保留人工确认

CI、定时任务、无人值守任务

先用副本验证

被拦后无人处理,流程可能中断

这里还有一个判断标准:如果这条命令跑坏了,你能不能快速回滚

能回滚,就可以试。不能回滚,就让它停下来等你。

打开网易新闻 查看精彩图片

我的建议:升级后先做这 5 步

如果你这几天准备升级 Claude Code,我建议别只看版本号。按下面 5 步过一遍,能少踩很多坑。

第一,看版本。

claude --version

第二,在不重要的项目里打开 autoMode.classifyAllShell,观察它会拦哪些命令。

/config autoMode.classifyAllShell=true

第三,跑几个低风险命令,看看体验变化。

git statusnpm testnpm run lint

第四,去 /permissions 看最近拒绝原因,重点看它到底在担心什么。

/permissions

第五,检查日志环境变量,尤其是团队机器和远程开发环境。

echo $OTEL_LOG_USER_PROMPTSecho $OTEL_LOG_ASSISTANT_RESPONSES

这 5 步做完,你基本就能判断这个开关适不适合当前项目。

打开网易新闻 查看精彩图片

最后说一句:Agent 越能干,越要先把闸门装好

这段时间,Claude Code、Codex、Hermes 这些工具都在往同一个方向走:让 Agent 接更完整的任务,跑更长的流程,连接更多工具。

但工具越强,越不能只靠“我相信它”。真正成熟的用法,是让 AI 去干活,同时给它清晰边界、命令审查、拒绝记录、日志策略和回滚方案。

Claude Code 2.1.193 的 autoMode.classifyAllShell,看起来只是一个配置项。放到 AI 编程工具的发展线上,它代表的信号更大:终端不再只是 Agent 的手脚,也开始变成需要被审计和管理的高风险通道。

我会这样总结这次更新:

Claude Code 现在不只是在提高执行效率,也在补执行前的判断系统。以后真正好用的 AI 编程工具,拼的不只是会不会跑命令,还包括能不能知道哪些命令先别跑。

打开网易新闻 查看精彩图片