RunCat跑了十年,因为没人需要打开它。AgentRunner想复制这个奇迹——但盯的不是CPU,是AI。

一个老梗的新生意

打开网易新闻 查看精彩图片

2014年,一只像素小猫住进macOS菜单栏。CPU越忙,它跑得越快。没人在意后台原理,但每个人都会下意识瞥一眼。

十年过去,这只猫还在跑。作者没更新过商业模式,没加过付费墙,没搞过"用户增长"。

现在AI开发者的菜单栏空了。Claude Code在后台烧token,Cursor在静默调用API,本地Ollama可能卡死在某个循环——但你的屏幕安静得像深夜办公室。

CPU占用?可能只有3%。风扇不转,猫也不跑。但你的agent正在以每秒一次的速度轰炸OpenAI端点。

这就是AgentRunner的出发点:我们需要一只新猫,跑在LLM流量上,而不是CPU负载上。

七条铁律,零个按钮

作者ww-w-ai在GitHub放了完整设计文档。没有"即将推出"的功能列表,只有七条已经实现的约束。

第一条:菜单栏是唯一入口。

「Same place as the clock. No extra tab, no extra window, no 'I'll open the dashboard later.'」

开发者平均每天打开47个标签页。第48个dashboard的宿命是被遗忘。AgentRunner拒绝成为其中之一。

第二条:资源消耗低于噪音地板。

CPU占用<1%,内存约20MB,SwiftUI原生。作者的原话很刻薄:「A monitor that becomes its own monitoring problem is a joke.」

我见过太多"轻量级"监控工具,最后自己成了被监控对象。这条红线画得漂亮。

第三条:拒绝花哨。

Animated traffic, live token deltas, color-coded latency heatmaps——作者列出一串行业常见病,然后宣布自己不治。这些功能第一周很爽,下个sprint就被关掉。CatRun活了十年,因为它从不索取注意力。

第四条:功能拆分。

Token花费、缓存命中率、运行历史——这些需要报表深度。作者另做了一个工具叫cc-token-saver,下篇博客单独讲。AgentRunner只负责"瞥一眼",cc-token-saver负责"查账"。

这个决策很反直觉。市面上99%的工具都想做All-in-One,结果变成All-in-None。作者选择主动截肢。

第五条:厂商中立。

不绑Claude,不绑OpenAI,不绑任何API key。Claude Code、Codex、Cursor、Windsurf、本地LLaMA via Ollama——只要是HTTPS调用的模型端点,都能看见。

第六条:本地唯一。

Zero telemetry。检测在本地完成,app不"打电话回家"。没有分析SDK,没有事件上报。作者的原话带着火气:「An agent monitor that ships your data anywhere doesn't deserve trust.」

第七条:二元状态。

Idle vs Active。这就是整个UI。没有渐变,没有百分比,没有"轻度活跃"的暧昧地带。猫要么在跑,要么在蹲。

16像素的商业课

AgentRunner的代码是Apache-2.0开源,GitHub仓库直接可下。没有付费墙,没有"Pro版",没有订阅陷阱。

但这件事的商业逻辑比很多SaaS更清晰。

RunCat模式已经被验证十年:极低认知负荷 × 极高使用频率 = 不可替代的屏幕位置。菜单栏是macOS的房地产黄金地段,比Dock更隐蔽,比桌面更持久。

AI开发者的痛点被严重低估。我们花了太多精力在模型选型、prompt工程、RAG架构上,却对"我的agent现在在干嘛"这个基础问题视而不见。

现有的解决方案要么太重(完整的可观测性平台),要么太专(某个IDE插件),要么太蠢(看CPU占用猜AI活动)。

AgentRunner卡在一个奇怪的中间地带:功能极简,但场景精准。它不解决"怎么优化",只解决"有没有在跑"。

这个定位让我想起另一个老产品——f.lux。同样是不问不答,同样是菜单栏常驻,同样是用视觉反馈替代复杂界面。f.lux后来被苹果抄进系统,但之前它独自跑了八年。

开源背后的信任账本

作者把"本地唯一"写进产品宪法,不是道德表演,是精准的用户心理洞察。

AI开发者正在经历一场信任危机。我们把代码、数据、API key交给各种agent工具,但不知道它们在后台干什么。Cursor的隐私政策更新过几次?Windsurf的数据保留多久?Claude Code的"本地模式"真的本地吗?

AgentRunner的回应是:我不碰你的数据,我甚至不碰你的网络。检测靠本地流量分析,代码全开源,许可证是Apache-2.0——你可以fork,可以审计,可以删掉我不喜欢的部分。

这种"防御性透明"正在成为AI工具的新门槛。不是加分项,是入场券。

cc-token-saver的预告也很有意思。作者明确区分"瞥一眼"和"查账"是两个场景,值得两个产品。这个判断背后是对开发者工作流的理解:监控是实时的,分析是批量的;前者要无感,后者要深度。

强行合并只会制造一个四不像。很多startup死在这里——功能列表越长,用户越不知道用它干什么。

一只猫能跑多远

AgentRunner现在只是GitHub上的一个repo,macOS 13+专属,16像素,跑或不跑。

但它的设计文档暴露了一个更大的野心:重新定义AI时代的"系统状态"指标。

CPU、内存、磁盘、网络——这些指标诞生于单机时代,描述的是机器的健康状况。但AI开发者的生产工具已经迁移:我们不再直接操作机器,而是操作agent;agent再操作机器。

中间这层抽象让传统监控失效。你的风扇安静,但你的账单在燃烧;你的CPU空闲,但你的agent在循环调用。

AgentRunner试图建立一个新的信号:LLM流量。不是替代旧指标,而是叠加一层语义。跑动的像素猫告诉你"有事情在发生",至于什么事情,你自己去查cc-token-saver。

这个分层设计很聪明。它承认自己的边界,不把用户绑架进一个封闭生态。

ww-w-ai没有透露下载数据,也没有画路线图。Repo里只有代码和这七条原则。但RunCat的十年先例说明,这种"不作为"可能是最好的产品策略。

你的菜单栏现在有几只猫?如果AgentRunner跑起来,你会让它住下,还是一周后关掉?