有个开发者花了三周时间优化API调用,就为了不超免费额度。他在给一家小型非营利组织做文档摘要工具,每次用量一涨,账单就跟着涨。最后只能上线一个半成品——完整版太贵,跑不起。
这是Gemma 4发布前,无数小团队的日常。
打开网易新闻 查看精彩图片
Google发布Gemma 4时,媒体都在聊参数:多模态输入、128K上下文、能在树莓派上运行。这些数字确实漂亮。但更值得琢磨的是另一件事——当靠谱的推理不再需要别人的服务器,游戏规则会变。
打开网易新闻 查看精彩图片
云AI一直有套隐形的规矩。你用别人的基础设施,就得按别人的条款来。计费表在转,API说改就改,定价说调就调。你建的东西,根基是租来的。大多数开发者接受了,就像接受房东一样——锅炉坏了你不会修,房租涨了要么认要么搬。
Gemma 4让这笔交易在很多实际场景里变得可选。你能用自己已有的硬件跑一个能用的模型。计费表停了,没人能吊销你的权限。
成本降了,延迟降了。半年前需要付费账号才能做的事,现在一个学生用笔记本就能干。但更隐蔽的变化在设计层面。按调用付费时,你满脑子是交易逻辑——要批处理、要优化、要绕着API的限制做架构。推理变成免费且本地的时候,这些顾虑消失了。你可以让它一直跑着。
几个具体场景:
——E2B版本装手机上,给网络条件差的地区做健康助手
打开网易新闻 查看精彩图片
——E4B版本在一台笔记本上处理法律援助诊所的语音记录
——26B的A4B版本让独立开发者用MacBook通宵跑任务
——31B版本部署在医院本地,满足那些 legally 不能用外部API的合规要求
背后没有谁的计费面板在偷偷计数。
行业默认的假设是:能用的AI一定住在别人的数据中心里。Gemma 4是个信号,这事正在变。现在更有趣的问题是——当基础设施真正属于你,人会造出什么来?
热门跟贴