谷歌最强开源大模型Gemma 4，支持多模态、离线运行|apache|产品经理|大模型|模态|知名企业|调用|谷歌

谷歌最强开源大模型Gemma 4，支持多模态、离线运行

2026年4月2日凌晨，谷歌DeepMind CEO Demis Hassabis在X上发了四颗钻石emoji，几个小时后，谜底揭晓——Gemma 4全系列正式发布。

这次不是常规更新，而是开源大模型格局的彻底重写。31B Dense版本直接冲到Arena AI排行榜全球第三，用不到十分之一的参数量就能跟400亿参数的巨无霸掰手腕。更关键的是，谷歌这次彻底放下姿态，全系列采用Apache 2.0开源协议，没有任何商业限制。

Gemma 4 是谷歌推出的一款 开源本地大模型，主要用于支持多模态数据处理和离线运行。该模型在人工智能领域具有重要的突破，尤其是在处理多种数据形式（如文本、图像、视频和语音）时的能力。它能够提供一种本地运行的解决方案，无需依赖持续的网络连接，适用于各种智能化应用场景。

一、四款模型，覆盖全场景

Gemma 4不是单一模型，而是一个完整的模型家族，从2B到31B全场景覆盖：

E2B（2.3B有效参数）
：专为手机、树莓派等端侧设备设计，内存占用可压至1.5GB以下，完全离线运行
E4B（4.5B有效参数）
：端侧旗舰，支持多模态输入，AIME 2026数学测试达42.5%
26B MoE
：混合专家架构，总参数260亿，推理时仅激活38亿参数，速度接近4B模型
31B Dense
：旗舰版本，Arena AI排名全球第三，单张H100即可运行

二、小模型打出大牌面

Gemma 4最让人震惊的，不是它有多大，而是它有多小却能打多强。

在Arena AI开源排行榜上，31B Dense冲到全球第三，Elo评分1452。排在前面的GLM-5和Kimi K2.5，参数量分别是它的20倍和30倍。谷歌把这叫做"每参数智能"——用更少的参数，达到更高的性能。

数学推理方面，AIME 2026成绩从上一代的21.2%跃升至89.2%，提升幅度高达68个百分点。这一成绩已经接近甚至超越部分闭源商业模型。

三、Apache 2.0协议

如果说性能是惊喜，那许可证的变化才是真正的重磅炸弹。

此前Gemma前三代产品用的都是谷歌自定义的开源协议，不仅有诸多商用限制，谷歌还能单方面修改规则。这次，Gemma 4全系列采用Apache 2.0许可证，意味着：

✅ 可自由用于商业用途
✅ 可修改、分发、二次开发
✅ 专利授权明确，降低法律风险
✅ 与现有开源生态无缝兼容

Hugging Face联合创始人Clément Delangue评价："这是开源AI领域的一个重大里程碑。"

四、核心技术亮点 1. 多模态能力

Gemma 4全系支持图像和视频输入，E2B和E4B还额外支持原生音频输入，内置约3亿参数的音频编码器。这意味着开发者可以用Gemma 4构建真正的多模态AI应用。

2. Agent原生支持

Gemma 4原生支持函数调用（Function Calling）和结构化JSON输出，内置System Prompt支持，可作为Agent的核心大脑，自主规划多步骤任务、调用外部工具。

3. 思考模式

所有Gemma 4模型均支持可开关的思考模式（Thinking Mode）。开启后，模型会先输出内部推理过程，再给出最终答案，适合复杂问题求解。

4. 超长上下文

31B和26B版本支持256K的超长上下文窗口，在同参数级别开源模型中属于顶级配置，可处理长文档、代码库分析等复杂任务。

五、部署教程方式一：Ollama（最简单）

安装ollama，进入 https://ollama.com/ 先下载ollama。


1# 安装Ollama（官网下载）

2# 运行不同版本：

3

4ollama run gemma4

5

6

7ollama run gemma4:e2b    # 2B端侧版

8ollama run gemma4:e4b    # 4B端侧版

9ollama run gemma4:26b    # 26B MoE版

10ollama run gemma4:31b    # 31B旗舰版

方式二：llama.cpp


1# macOS安装

2brew install llama.cpp --HEAD

3

4# 运行

5llama-server -hf ggml-org/gemma-4-26B-A4B-it-GGUF:Q4_K_M

方式三：Mac用户（MLX）


1# 安装

2uv pip install-U mlx-vlm

3

4# 运行（带TurboQuant优化）

5uv run mlx_vlm.generate --model google/gemma-4-31b-it --kv-bits 3.5

硬件要求参考

E2B/E4B
：8GB内存即可，手机、树莓派都能跑
26B MoE
：推荐16GB+显存，消费级GPU工作站
31B Dense
：推荐24GB+显存，单张H100或RTX 4090

六、总结

Gemma 4标志着谷歌在开源AI领域的战略转向：从"提供替代品"到"争夺基础设施层"。Apache 2.0许可证、原生Agent支持、多模态覆盖的组合，使其成为2026年最值得关注的开源模型发布之一。

谷歌最强开源大模型Gemma 4，支持多模态、离线运行

热搜

热门跟贴

热搜

热门跟贴

相关推荐

谷歌把大模型价格砍到7分钱，本地部署党突然算不过账了

Google把2.5GB大模型塞进iPhone

谷歌把这技术藏了8年，2026年突然摊牌了

谷歌AI Studio被开发者玩出花：3天搓出旅行翻译神器

谷歌Gemini语音延迟压到500毫秒内，开发者却栽在回声消除上

阿里开源9B模型：3个隐藏开关让AI"口无遮拦"

中国AI大模型全球调用量再创新高，前六名全部来自中国

杨立昆发布史上最“轻”世界模型，单GPU可训，规划速度提升48倍

1人写出6万行代码，Gemini在UI上栽了跟头

GEO是什么？AI时代最不能忽视的流量逻辑

谷歌把BERT藏了7年，开发者发现后集体懵了：原来搜索还能这么玩

Google把AI Agent开源后，3天被微软云"截胡"了

4G内存跑安全大模型：一个工程师把DeepSeek蒸馏到能装进U

开源作者把5个免费账号拼成1个无限额度，AI公司还没反应过来

GitHub把代码导航做烂了3年，这个开源工具用4面板打脸

OpenAI又一关键高管离职！曾为GPT-4o注入灵魂

哈萨比斯传记里讲了好多八卦啊

免费无限用！谷歌上线了一款AI语音转写神器

DeepSeek大升级/史上最强Claude发布/新iPhone机模曝光

最强大脑组合！全球SOTA逻辑和记忆CodeBrain-1&MemBrain1.5开源