谷歌Gemma 4炸场：1张显卡跑140亿参数，老黄笑不出来了

固件更新中

2026-04-06 22:54 ·北京

谷歌今天把Gemma 4端上桌了。这模型最狠的不是参数，是胃口——140亿参数的活儿，一张H100就能吞下去。以前跑这种规模的模型，你得凑一桌显卡开席，现在单卡solo就行。

谷歌在AI Studio里直接开了免费试玩，模型权重也往Hugging Face扔了。但老玩家都懂，谷歌放模型向来是"先开枪再画靶"，Gemma系列之前几次更新，社区反馈都是"能用，但没必要"。这次把效率卷到这种程度，摆明了是冲着端侧和中小开发者去的。

有个细节挺扎心：Gemma 4的27B版本在单卡性能上，已经能跟Llama 3的70B掰手腕。谷歌自己晒的基准测试图里，数学和代码题的正确率涨了两位数。一位在Hugging Face下面留言的开发者说：「终于不用为了省算力，把模型砍成智障版了。」

不过谷歌没说的是，这种"单卡奇迹"很大程度上靠了量化压缩的暴力美学——模型精度有没有暗伤，还得等社区喂一波真实数据才知道。目前AI Studio的免费额度已经有人排队，Hugging Face的下载量两小时破了五位数。

最尴尬的是英伟达。H100本来是数据中心的大锅饭，现在被谷歌调教成单人小灶。老黄去年还在财报会上说"算力永远不够"，今天Gemma 4的发布稿里，谷歌产品副总裁专门加了一句"感谢英伟达硬件支持"——场面话，但听着像补刀。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴