在终端输入claude,然后靠回椅背,看着AI自动完成重构或写测试——这种体验曾经让我以为找到了开发效率的终极答案。但没过多久,我开始盯着终端里那个旋转的加载动画发呆,心里只有一个念头:它到底在里面干什么?

这个黑箱问题最终演变成时间和预算的双重浪费。我意识到,如果不解决它,所谓的"自主AI开发"就只是空谈。这篇文章记录了我如何将Claude Code的效率提升10倍,以及我开发Argus来解决这个黑箱问题的全过程。

打开网易新闻 查看精彩图片

无人值守时的三大隐性危机

打开网易新闻 查看精彩图片

当我把Claude Code丢进复杂的生产代码库、转身去干别的事时,三种沉默的危机正在后台悄然消耗我的资源:

第一,不可见的重试循环。当agent在bash命令或测试用例中遇到错误时,它有时会在后台用完全相同的错误步骤反复调用同一工具。终端只显示一个无害的加载动画,但token和我的预算正在飞速燃烧。等我察觉异常停止进程时,损失已经造成。

第二,上下文膨胀与幻觉。找不到正确路径的agent会不必要地反复读取同一份大文件,导致上下文窗口急剧膨胀。一旦触及上限,agent就开始遗忘几步前刚做过的事,逐渐偏离轨道,陷入幻觉循环。

第三,事后追责的无力感。等一切结束、任务失败后才发现"agent在这里犯了错",这并不能节省任何时间。我需要在agent偏离航向的瞬间就察觉并干预,而不是事后读日志。

这让我想到网络安全领域的一个基本原则:没有端点行为或系统遥测的实时监控,就无法管理系统。AI agent同理——没有实时遥测,就是在盲飞。

Argus:给黑箱装上实时视野

为了突破这个瓶颈,我设计了一个现代遥测站,用于即时追踪、分析和管理Claude Code会话:Argus。

Argus是一个开源的VS Code扩展,配备极简、性能优先的界面,作为分析引擎让自主过程完全透明。集成Argus后,我的Claude Code效率确实达到了10倍提升。核心能力包括:

打开网易新闻 查看精彩图片

实时会话追踪:我能精确看到agent正在检查哪个文件、触发哪个子agent、执行哪条命令——全部实时呈现。

成本可视化:token消耗速率、API调用次数、当前步骤的预估成本,一目了然。重试循环一旦启动,我能在预算失控前秒级响应。

上下文健康监控:实时显示上下文窗口使用比例、最近访问文件列表、重复读取警告。当agent开始"健忘",我能立即察觉。

干预接口:发现偏离时,一键暂停、回滚到指定步骤、或注入修正指令——无需等它跑完再收拾残局。

从盲飞到可控自主

Argus的本质是把"委托后祈祷"变成"委托后监控"。它不改变Claude Code的能力边界,而是消除了使用过程中的信息不对称。这种透明性带来的效率提升是复合的:省下的不只是烧掉的token,还有等待时的焦虑、事后排查的时间、以及反复试错的心理成本。

对于正在用或打算用AI agent的开发者,我的建议很直接:在把复杂任务交给agent之前,先确保你能看见它在做什么。黑箱里的效率是幻觉,可视化的自主才是真的生产力。