打开网易新闻 查看精彩图片
谷歌今天把Gemma 4端上桌了。这模型最狠的不是参数,是胃口——140亿参数的活儿,一张H100就能吞下去。以前跑这种规模的模型,你得凑一桌显卡开席,现在单卡solo就行。
谷歌在AI Studio里直接开了免费试玩,模型权重也往Hugging Face扔了。但老玩家都懂,谷歌放模型向来是"先开枪再画靶",Gemma系列之前几次更新,社区反馈都是"能用,但没必要"。这次把效率卷到这种程度,摆明了是冲着端侧和中小开发者去的。
有个细节挺扎心:Gemma 4的27B版本在单卡性能上,已经能跟Llama 3的70B掰手腕。谷歌自己晒的基准测试图里,数学和代码题的正确率涨了两位数。一位在Hugging Face下面留言的开发者说:「终于不用为了省算力,把模型砍成智障版了。」
不过谷歌没说的是,这种"单卡奇迹"很大程度上靠了量化压缩的暴力美学——模型精度有没有暗伤,还得等社区喂一波真实数据才知道。目前AI Studio的免费额度已经有人排队,Hugging Face的下载量两小时破了五位数。
最尴尬的是英伟达。H100本来是数据中心的大锅饭,现在被谷歌调教成单人小灶。老黄去年还在财报会上说"算力永远不够",今天Gemma 4的发布稿里,谷歌产品副总裁专门加了一句"感谢英伟达硬件支持"——场面话,但听着像补刀。
热门跟贴