Google Gemma 4一周破200万下载

野生运营

2026-04-07 08:24 ·北京

200万。这是Gemma 4上线7天的下载量，而它的前辈Gemma 3花了一年才攒到670万。

更刺眼的是对比：阿里Qwen 3.5的旗舰模型发布1.5个月，总下载量2700万——但那是包含3970亿参数的云端巨兽。Gemma 4的凶猛在于，它让普通人手里的iPhone变成了能跑40 token/秒的本地AI引擎。

从"跑分冠军"到"即插即用"

从"跑分冠军"到"即插即用"

Hugging Face CEO Clément Delangue 的推文被反复转发：Gemma 4登顶平台趋势榜，不是因为刷榜，而是"practical usability"——实用主义。

这种实用主义有具体画面。@adrgrondin 把Gemma 4 E2B塞进iPhone 17 Pro，MLX框架下跑出40 tok/s；@enjojoyy 跟进了同样的部署；@_philschmid 则在AI Edge Gallery里演示了用技能调维基百科查询。Red Hat同步发布了31B版本的量化模型卡，NVFP4和FP8-block格式，指令跟随评估已上线，推理和视觉评估待更新。

开源模型的竞争逻辑变了。过去是"我参数比你多"，现在是"你能在便利店WiFi下跑起来吗"。

订阅经济的裂缝

订阅经济的裂缝

@AlexEngineerAI 的观察很直接：本地跑的Gemma 4已经够好用，Claude订阅对部分人来说不再划算。@ben_burtenshaw 补了一刀——Hugging Face托管的模型免费，能替换掉agent工作流里的付费环节。

Ollama的动作更快。Gemma 4上线Ollama Cloud，后端是NVIDIA Blackwell GPU，OpenClaw和Claude式工作流无需自建服务器就能调用。免费层在蚕食付费层的地基。

@osanseviero 列出的生态名单值得细看：Hugging Face、vLLM、llama.cpp、Ollama、NVIDIA、Unsloth、SGLang、Docker、Cloudflare……"开放模型成功"的定义正在被改写——不是权重开源就完事，而是发布当天下游系统全部就绪。

Hermes Agent的暗线

Hermes Agent的暗线

同期还有一条被低估的线索：Hermes Agent的自我改进循环。Turing Post对比了Hermes与OpenClaw的差异，核心争议在于开放轨迹数据（open trace data）的推进力度。agent框架的竞赛，正在从"谁能调用更多工具"转向"谁能用更少人工干预完成闭环"。

Gemma 4的200万下载是一个信号，但信号的方向还没完全清晰——它究竟会催生更多本地优先的独立开发者，还是最终被云服务商的"免费层"收编？

Google三天后将在伦敦举办Gemma 4主题演讲，议程尚未公开。一个值得追问的细节是：当端侧算力足够跑起31B模型，云厂商的定价权还能撑多久？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴