打开网易新闻 查看精彩图片

128GB内存的M5 MacBook Pro到手后,西蒙·威利森(Simon Willison)干的第一件事不是跑分,而是对着Activity Monitor骂了句脏话。

这位Django框架的联合创始人、前Eventbrite技术VP,现在最出圈的身份是"AI原生开发"的野生代言人。他没去找第三方工具,也没自己动手写代码——而是打开Claude Opus 4.6,扔了句:"给我看看这台机器到互联网的带宽,别算局域网。"

47分钟后,Bandwidther诞生了。一个能实时显示各应用网络占用、带反向DNS解析的菜单栏工具,全程没打开过Xcode。

这还没完。同一时间段,他在另一个会话里用GPT-5.4搓出了Gpuer——专门监控GPU和显存占用的同款工具。两个app的源代码加起来,能塞进一个微信聊天框。

「氛围编程」的第二次实验

「氛围编程」的第二次实验

威利森把这叫"vibe coding",氛围编程。今年3月他第一次玩这个,是用Claude做了个macOS演示文稿工具。那次是试水,这次是动真格——直接替代自己每天用的系统工具。

关键发现让他很意外:Claude Opus 4.6和GPT-5.4对SwiftUI的掌握程度,已经到"不用拆文件"的地步。整个app一个文本文件搞定,LLM能直接生成可编译的完整代码。

他的提示词粗糙到近乎挑衅。第一版Bandwidther就三句话:mkdir建目录、写个原生SwiftUI app、要实时显示网络详情。Claude不仅照做了,还主动建议做成菜单栏图标。

「git init和git commit现在的样子」,这是他第二个提示词。威利森的原话:「因为我要开始加新功能了。」

接下来的迭代更像产品经理给工程师提需求:加进程级带宽、反向DNS但保留原始IP、改双栏布局、缩成菜单栏图标。每个需求一句话,Claude自己补全技术实现。

打开网易新闻 查看精彩图片

为什么Activity Monitor"该慌了"

为什么Activity Monitor"该慌了"

威利森做Bandwidther的原始动机很具体:想知道Dropbox是在用局域网从旧电脑同步,还是从互联网重新下载。Activity Monitor给不了这个粒度。

Gpuer的诞生同理。macOS的GPU显存占用、Metal计算任务详情,官方工具要么藏得深,要么直接不显示。威利森的提示词是:「我想知道GPU和RAM用了多少,Activity Monitor里好像看不到。」

两个工具的核心数据来自系统底层接口:network_statistics框架、system_profiler、memory_pressure,再加私有API嗅探。这些接口一直存在,但普通开发者要拼凑好几天,LLM 10分钟理清调用链。

成品的功能密度很夸张。Bandwidther左侧是进程级上下行带宽,右侧拆成三块:实时总流量图、反向DNS解析的远程地址、原始IP小字备注。Gpuer同步显示GPU利用率、显存压力、温度、各进程Metal任务占比。

全是菜单栏点击展开,不占Dock,不抢焦点。威利森把代码开源在GitHub,build指令就两行:swift build,然后拖到应用程序文件夹。

开发者的"外包幻觉"与真实边界

开发者的"外包幻觉"与真实边界

威利森公开了完整对话记录,Bandwidther的transcript有47轮,Gpuer更短——因为能直接引用半成品当例子。这是氛围编程的隐藏技巧:第一个项目当模板,第二个项目复制架构。

但别误会,这不是"AI写代码人类喝咖啡"。威利森在推上补了细节:两轮debug来回修了不少bug,Claude对Swift并发模型的理解偶尔掉链子,GPU数据解析的格式错误得人工指出来。

他的真实角色是产品经理+QA。定需求、验结果、给反馈、拍板优先级。Claude的优势是"知道什么是可能的"——威利森的原话——能提出人类开发者想不到的功能组合。

打开网易新闻 查看精彩图片

比如菜单栏图标这个设计,是Claude主动建议的。人类开发者可能先想做个完整窗口应用,LLM直接跳到最后一步:最小侵入式交互。

代价也有。单文件架构意味着没有模块化,功能堆多了会失控。威利森目前控制在"够用就停":Bandwidther 1.0就是终点,除非又有新痛点。

128GB M5的隐藏打开方式

128GB M5的隐藏打开方式

这次实验的硬件背景值得注意。威利森特意提了128GB内存的M5 MacBook Pro——不是炫耀,是点明本地LLM的可用性拐点。

Claude Opus 4.6和GPT-5.4都能本地跑,意味着代码生成不需要联网、没有API延迟、没有数据出境顾虑。128GB内存足够同时开多个模型会话,Bandwidther和Gpuer就是并行开发的。

这对企业开发者的诱惑很大。内部工具、监控面板、数据可视化——以前排期两周的需求,现在下午出原型。威利森的模式可复制:一个会话保架构,多个会话并行搓功能模块。

但他没说的是长期维护成本。SwiftUI版本迭代、macOS系统更新、私有API失效——这些需要持续投入。氛围编程擅长从0到1,从1到N还是未知数。

目前两个项目都是"个人够用即开源",没有roadmap,没有issue响应承诺。威利森的GitHub仓库描述很诚实:「我用的工具,顺便分享。」

Activity Monitor团队大概不会真的慌。系统级监控工具需要处理边界情况、权限沙盒、能耗优化——这些脏活LLM不会主动做,人类开发者也得被折磨几个月才长记性。

但威利森的实验戳破了一层窗户纸:当特定需求足够具体、当开发者愿意接受"够用就好"的交付标准,传统软件开发的成本结构已经被重写。

下一个被"氛围编程"掀桌的会是谁?