一个周末,我把OpenAI的Chronicle换成了本地Gemma 4。

过去一周,我的MacBook上跑着OpenAI的研究预览版Chronicle。每十分钟截屏一次,上传帧画面到OpenAI服务器分析,再把Markdown摘要写回本地。我把那个文件夹爬取下来,灌进家庭实验室的Postgres表里。

打开网易新闻 查看精彩图片

能跑。但每一轮注意力循环都要烧积分。

这个周末,我把它换成了单台599美元Mac mini上的Gemma 4 E4B 4-bit MLX实例。四个独立传感器流本地摘要,零外部LLM调用,边际推理成本基本为零。

OpenAI自己的文档写得直白:截屏上传到自家服务器处理;该功能"快速消耗速率限制";"增加提示注入风险";记忆以"未加密Markdown文件"形式存储在用户机器上;欧盟、英国、瑞士不可用。Chronicle是Pro档定价的Pro档功能。架构选择很诚实:云端推理、按帧计费、模型归属OpenAI。

我要的是另一种形态。

不是更好的云服务。是单台Mac mini上的Gemma 4 E4B 4-bit MLX实例,同时处理四个传感器——我的屏幕、一台可穿戴相机、客厅安防摄像头、以及可穿戴设备的实时AI commentary——全部写入一张Postgres表,摄入时即脱敏,可用SQL查询。零外部LLM调用。零按帧成本。

同一个模型实例还承担着家庭实验室其余视觉负载。

第五个传感器已经在快递盒里(Raspberry Pi Zero 2 W),边际成本就是运费。

这是五天前那篇Gemma 4家庭实验室AI网关文章的续集。那篇结尾说:"Anvil不只是开发机。对某些多模态工作,它是个有用的推理目标。"这篇讲Anvil毕业。

为什么选Gemma 4 E4B,按重要程度排序:

原生多模态单checkpoint。图像、视频、音频路径在同一文件里。整个传感器网格只加载一次权重。无需按输入类型切换模型。

16GB统一内存够用。4-bit MLX构建峰值驻留约6GB,共租负载下约8.5GB。基础款M系列Mac mini上,给操作系统、FastAPI守护进程、菜单栏监控应用留足余量。

Apache 2.0权重。模型文件在我机器上。没人能 deprecate 它、连夜改价、或按地区限制。

它已经在跑了。我之前就通过Forge路由这个模型做别的事。为Logbook单独再开一个才是浪费。一个Gemma 4实例,两个生产角色。

四个传感器,一个信封。