AI自主决策权扩大，Anthropic为Claude Code引入自动模式

华尔街见闻官方

2026-03-25 06:16 ·上海 ·华尔街见闻官方网易号

Anthropic正在赋予其AI编程工具更大的自主权，同时试图在效率与安全之间寻求平衡。

3月24日，Anthropic宣布为Claude Code推出"自动模式"（auto mode），允许AI自行判断哪些操作可以直接执行，无需等待用户逐一确认。

这一功能目前以研究预览版形式面向团队计划用户开放，未来数日内将扩展至企业版及API用户。

新功能的核心在于内置安全机制，每项操作在执行前均会经过AI安全层的审查，系统将自动放行被判定为安全的操作，并拦截存在风险的行为。

Anthropic表示，该安全层还可检测提示注入攻击，即恶意指令被隐藏在AI正在处理的内容中，试图诱导模型执行非预期操作。

该公司建议用户在隔离的沙盒环境中使用这一新功能，以防止潜在风险蔓延至生产系统。

开发者痛点驱动产品迭代

对于当前使用AI编程工具的开发者而言，一个普遍困境是，要么对AI的每一步操作全程监督，要么放手让模型自行运行，由此承担不可预知的风险。

Anthropic的自动模式本质上是对Claude Code现有的"不会再向用户请求确认（dangerously-skip-permissions）"命令的升级延伸。

该命令原本将所有决策权完全交由AI处理，而新模式则在此基础上叠加了一层安全过滤机制。

通过让AI而非用户来决定何时需要申请权限，Anthropic试图在不牺牲执行效率的前提下，为开发者提供更高程度的安全保障。

GitHub、OpenAI等公司已相继推出能够代替开发者执行任务的自主编程工具，Anthropic此次的举措在此基础上进一步推进，将权限决策的主导权从用户一侧转移至AI本身。

自动模式的发布，紧随Anthropic近期一系列产品更新之后，包括用于在代码合并前自动捕捉缺陷的Claude Code Review，以及允许用户将任务委派给AI代理处理的Dispatch for Cowork。

这一系列布局显示，Anthropic正系统性地构建面向企业开发者的自主化AI工作流产品矩阵。

关键细节尚待厘清

尽管如此，这一功能仍存在值得关注的不确定性。

Anthropic目前尚未公开其安全层判定操作风险等级的具体标准，而这恰恰是开发者在大规模采用该功能前最需要了解的核心信息。

此外，自动模式目前仅支持Claude Sonnet 4.6与Opus 4.6两款模型，且仍处于研究预览阶段，意味着该产品尚未最终定型。

对于考虑在生产环境周边部署这一功能的企业用户而言，上述限制与信息不透明之处或将是其审慎评估的重要依据。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴