有个开发者花了三周时间优化API调用,就为了不超免费额度。他在给一家小型非营利组织做文档摘要工具,每次用量一涨,账单就跟着涨。最后只能上线一个半成品——完整版太贵,跑不起。

这是Gemma 4发布前,无数小团队的日常。

打开网易新闻 查看精彩图片

Google发布Gemma 4时,媒体都在聊参数:多模态输入、128K上下文、能在树莓派上运行。这些数字确实漂亮。但更值得琢磨的是另一件事——当靠谱的推理不再需要别人的服务器,游戏规则会变。

打开网易新闻 查看精彩图片

云AI一直有套隐形的规矩。你用别人的基础设施,就得按别人的条款来。计费表在转,API说改就改,定价说调就调。你建的东西,根基是租来的。大多数开发者接受了,就像接受房东一样——锅炉坏了你不会修,房租涨了要么认要么搬。

Gemma 4让这笔交易在很多实际场景里变得可选。你能用自己已有的硬件跑一个能用的模型。计费表停了,没人能吊销你的权限。

成本降了,延迟降了。半年前需要付费账号才能做的事,现在一个学生用笔记本就能干。但更隐蔽的变化在设计层面。按调用付费时,你满脑子是交易逻辑——要批处理、要优化、要绕着API的限制做架构。推理变成免费且本地的时候,这些顾虑消失了。你可以让它一直跑着。

几个具体场景:

——E2B版本装手机上,给网络条件差的地区做健康助手

打开网易新闻 查看精彩图片

——E4B版本在一台笔记本上处理法律援助诊所的语音记录

——26B的A4B版本让独立开发者用MacBook通宵跑任务

——31B版本部署在医院本地,满足那些 legally 不能用外部API的合规要求

背后没有谁的计费面板在偷偷计数。

行业默认的假设是:能用的AI一定住在别人的数据中心里。Gemma 4是个信号,这事正在变。现在更有趣的问题是——当基础设施真正属于你,人会造出什么来?