Anthropic正在赋予其AI编程工具更大的自主权,同时试图在效率与安全之间寻求平衡。
3月24日,Anthropic宣布为Claude Code推出"自动模式"(auto mode),允许AI自行判断哪些操作可以直接执行,无需等待用户逐一确认。
这一功能目前以研究预览版形式面向团队计划用户开放,未来数日内将扩展至企业版及API用户。
新功能的核心在于内置安全机制,每项操作在执行前均会经过AI安全层的审查,系统将自动放行被判定为安全的操作,并拦截存在风险的行为。
Anthropic表示,该安全层还可检测提示注入攻击,即恶意指令被隐藏在AI正在处理的内容中,试图诱导模型执行非预期操作。
该公司建议用户在隔离的沙盒环境中使用这一新功能,以防止潜在风险蔓延至生产系统。
开发者痛点驱动产品迭代
对于当前使用AI编程工具的开发者而言,一个普遍困境是,要么对AI的每一步操作全程监督,要么放手让模型自行运行,由此承担不可预知的风险。
Anthropic的自动模式本质上是对Claude Code现有的"不会再向用户请求确认(dangerously-skip-permissions)"命令的升级延伸。
该命令原本将所有决策权完全交由AI处理,而新模式则在此基础上叠加了一层安全过滤机制。
通过让AI而非用户来决定何时需要申请权限,Anthropic试图在不牺牲执行效率的前提下,为开发者提供更高程度的安全保障。
GitHub、OpenAI等公司已相继推出能够代替开发者执行任务的自主编程工具,Anthropic此次的举措在此基础上进一步推进,将权限决策的主导权从用户一侧转移至AI本身。
自动模式的发布,紧随Anthropic近期一系列产品更新之后,包括用于在代码合并前自动捕捉缺陷的Claude Code Review,以及允许用户将任务委派给AI代理处理的Dispatch for Cowork。
这一系列布局显示,Anthropic正系统性地构建面向企业开发者的自主化AI工作流产品矩阵。
关键细节尚待厘清
尽管如此,这一功能仍存在值得关注的不确定性。
Anthropic目前尚未公开其安全层判定操作风险等级的具体标准,而这恰恰是开发者在大规模采用该功能前最需要了解的核心信息。
此外,自动模式目前仅支持Claude Sonnet 4.6与Opus 4.6两款模型,且仍处于研究预览阶段,意味着该产品尚未最终定型。
对于考虑在生产环境周边部署这一功能的企业用户而言,上述限制与信息不透明之处或将是其审慎评估的重要依据。
热门跟贴