Gemma 4发布：31B模型干翻400B，本地AI时代来了

硬核玩家2哈

2026-05-25 02:21 ·北京

Google DeepMind刚扔下一枚炸弹。Gemma 4全家桶开源，Apache 2.0协议，最狠的是那个31B的密集模型——跑分直接碾压比自己大20倍的对手。

这事的核心矛盾很尖锐：云端的AI越来越强，但本地部署一直是个笑话。现在Google说，不用选了，笔记本和手机就能跑前沿模型。这不是技术迭代，是游戏规则重写。

先看清牌面。Gemma 4不是单卡出牌，是四张牌覆盖全场景：

E2B（20亿有效参数）：总参数量5.1B，压缩后内存不到1.5GB，128K上下文，带音频编码器。手机、IoT设备塞进去无压力。

E4B（45亿有效参数）：总参数量8B，同样128K上下文。旗舰手机和MacBook的甜点区，开发者首选。

26B A4B（混合专家架构）：总参数量25.2B，但每次只激活约4B。128个小专家里选8个路由专家加1个共享专家，用12%的算力干出密集31B模型97%的质量。256K上下文，企业级成本敏感场景的王牌。

31B Dense（密集模型）：纯血31B参数，256K上下文，需要18-24GB内存。推理能力的极限选项。

数字说话最硬。Gemma 4 31B在Artificial Analysis Intelligence Index拿39分，比Gemma 3 27B的10分暴涨29分。具体拆解：

数学推理（AIME 2026）：20.8% → 89.2%，4倍提升。
代码能力（LiveCodeBench）：29.1% → 80.0%，接近3倍。
研究生级科学（GPQA Diamond）：直接翻倍到84.3%。
智能体工作流（T2-Bench）：6.6% → 86.4%，13倍跃迁。

最刺耳的对比：31B模型在多项基准上击败Qwen3.5-397B和DeepSeek v3.2-671B。参数差一个数量级，结果倒过来。本地部署的算力账，从此要重新算。

Google押注的是一条清晰的路径——把前沿AI从服务器机房搬到边缘设备，不阉割能力。Apache 2.0协议意味着没有商用限制，没有API按token计费的黑箱。私有、可控、主权化的AI，从口号变成可执行方案。

问题已经变了。不再是"本地能不能跑大模型"，而是"你要造什么"。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴