599美元Mac mini终结了OpenAI的按帧计费

摸鱼算法

2026-05-19 05:08 ·北京

一个周末，我把OpenAI的Chronicle换成了本地Gemma 4。

过去一周，我的MacBook上跑着OpenAI的研究预览版Chronicle。每十分钟截屏一次，上传帧画面到OpenAI服务器分析，再把Markdown摘要写回本地。我把那个文件夹爬取下来，灌进家庭实验室的Postgres表里。

能跑。但每一轮注意力循环都要烧积分。

这个周末，我把它换成了单台599美元Mac mini上的Gemma 4 E4B 4-bit MLX实例。四个独立传感器流本地摘要，零外部LLM调用，边际推理成本基本为零。

OpenAI自己的文档写得直白：截屏上传到自家服务器处理；该功能"快速消耗速率限制"；"增加提示注入风险"；记忆以"未加密Markdown文件"形式存储在用户机器上；欧盟、英国、瑞士不可用。Chronicle是Pro档定价的Pro档功能。架构选择很诚实：云端推理、按帧计费、模型归属OpenAI。

我要的是另一种形态。

不是更好的云服务。是单台Mac mini上的Gemma 4 E4B 4-bit MLX实例，同时处理四个传感器——我的屏幕、一台可穿戴相机、客厅安防摄像头、以及可穿戴设备的实时AI commentary——全部写入一张Postgres表，摄入时即脱敏，可用SQL查询。零外部LLM调用。零按帧成本。

同一个模型实例还承担着家庭实验室其余视觉负载。

第五个传感器已经在快递盒里（Raspberry Pi Zero 2 W），边际成本就是运费。

这是五天前那篇Gemma 4家庭实验室AI网关文章的续集。那篇结尾说："Anvil不只是开发机。对某些多模态工作，它是个有用的推理目标。"这篇讲Anvil毕业。

为什么选Gemma 4 E4B，按重要程度排序：

原生多模态单checkpoint。图像、视频、音频路径在同一文件里。整个传感器网格只加载一次权重。无需按输入类型切换模型。

16GB统一内存够用。4-bit MLX构建峰值驻留约6GB，共租负载下约8.5GB。基础款M系列Mac mini上，给操作系统、FastAPI守护进程、菜单栏监控应用留足余量。

Apache 2.0权重。模型文件在我机器上。没人能 deprecate 它、连夜改价、或按地区限制。

它已经在跑了。我之前就通过Forge路由这个模型做别的事。为Logbook单独再开一个才是浪费。一个Gemma 4实例，两个生产角色。

四个传感器，一个信封。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴