Google DeepMind刚扔下一枚炸弹。Gemma 4全家桶开源,Apache 2.0协议,最狠的是那个31B的密集模型——跑分直接碾压比自己大20倍的对手。
这事的核心矛盾很尖锐:云端的AI越来越强,但本地部署一直是个笑话。现在Google说,不用选了,笔记本和手机就能跑前沿模型。这不是技术迭代,是游戏规则重写。
先看清牌面。Gemma 4不是单卡出牌,是四张牌覆盖全场景:
E2B(20亿有效参数):总参数量5.1B,压缩后内存不到1.5GB,128K上下文,带音频编码器。手机、IoT设备塞进去无压力。
E4B(45亿有效参数):总参数量8B,同样128K上下文。旗舰手机和MacBook的甜点区,开发者首选。
26B A4B(混合专家架构):总参数量25.2B,但每次只激活约4B。128个小专家里选8个路由专家加1个共享专家,用12%的算力干出密集31B模型97%的质量。256K上下文,企业级成本敏感场景的王牌。
31B Dense(密集模型):纯血31B参数,256K上下文,需要18-24GB内存。推理能力的极限选项。
数字说话最硬。Gemma 4 31B在Artificial Analysis Intelligence Index拿39分,比Gemma 3 27B的10分暴涨29分。具体拆解:
数学推理(AIME 2026):20.8% → 89.2%,4倍提升。
代码能力(LiveCodeBench):29.1% → 80.0%,接近3倍。
研究生级科学(GPQA Diamond):直接翻倍到84.3%。
智能体工作流(T2-Bench):6.6% → 86.4%,13倍跃迁。
最刺耳的对比:31B模型在多项基准上击败Qwen3.5-397B和DeepSeek v3.2-671B。参数差一个数量级,结果倒过来。本地部署的算力账,从此要重新算。
Google押注的是一条清晰的路径——把前沿AI从服务器机房搬到边缘设备,不阉割能力。Apache 2.0协议意味着没有商用限制,没有API按token计费的黑箱。私有、可控、主权化的AI,从口号变成可执行方案。
问题已经变了。不再是"本地能不能跑大模型",而是"你要造什么"。
热门跟贴