200万。这是Gemma 4上线7天的下载量,而它的前辈Gemma 3花了一年才攒到670万。
更刺眼的是对比:阿里Qwen 3.5的旗舰模型发布1.5个月,总下载量2700万——但那是包含3970亿参数的云端巨兽。Gemma 4的凶猛在于,它让普通人手里的iPhone变成了能跑40 token/秒的本地AI引擎。
从"跑分冠军"到"即插即用"
Hugging Face CEO Clément Delangue 的推文被反复转发:Gemma 4登顶平台趋势榜,不是因为刷榜,而是"practical usability"——实用主义。
这种实用主义有具体画面。@adrgrondin 把Gemma 4 E2B塞进iPhone 17 Pro,MLX框架下跑出40 tok/s;@enjojoyy 跟进了同样的部署;@_philschmid 则在AI Edge Gallery里演示了用技能调维基百科查询。Red Hat同步发布了31B版本的量化模型卡,NVFP4和FP8-block格式,指令跟随评估已上线,推理和视觉评估待更新。
开源模型的竞争逻辑变了。过去是"我参数比你多",现在是"你能在便利店WiFi下跑起来吗"。
订阅经济的裂缝
@AlexEngineerAI 的观察很直接:本地跑的Gemma 4已经够好用,Claude订阅对部分人来说不再划算。@ben_burtenshaw 补了一刀——Hugging Face托管的模型免费,能替换掉agent工作流里的付费环节。
Ollama的动作更快。Gemma 4上线Ollama Cloud,后端是NVIDIA Blackwell GPU,OpenClaw和Claude式工作流无需自建服务器就能调用。免费层在蚕食付费层的地基。
@osanseviero 列出的生态名单值得细看:Hugging Face、vLLM、llama.cpp、Ollama、NVIDIA、Unsloth、SGLang、Docker、Cloudflare……"开放模型成功"的定义正在被改写——不是权重开源就完事,而是发布当天下游系统全部就绪。
Hermes Agent的暗线
同期还有一条被低估的线索:Hermes Agent的自我改进循环。Turing Post对比了Hermes与OpenClaw的差异,核心争议在于开放轨迹数据(open trace data)的推进力度。agent框架的竞赛,正在从"谁能调用更多工具"转向"谁能用更少人工干预完成闭环"。
Gemma 4的200万下载是一个信号,但信号的方向还没完全清晰——它究竟会催生更多本地优先的独立开发者,还是最终被云服务商的"免费层"收编?
Google三天后将在伦敦举办Gemma 4主题演讲,议程尚未公开。一个值得追问的细节是:当端侧算力足够跑起31B模型,云厂商的定价权还能撑多久?
热门跟贴