Google炸场！最强轻量级、开放模型Gemma发布，个人PC就能用，内部员工：强是强，但名字取得让我混乱！|gemma|meta|tensorflow|开放模型|视频生成模型|谷歌

整理 | 屠敏

出品 | CSDN（ID：CSDNnews）

不同于 OpenAI 的闭源大模型，Google、Meta 等科技巨头正在发力开放模型来实现弯道超车。

2 月 21 日，Google 推出新一代开放 AI 模型——Gemma（https://ai.google.dev/gemma），这是一个轻量级的模型，比肩 Meta 的。

仅是从名称上来看，最新推出的 Gemma 和此前 Google 的 Gemini 还有点傻傻分不清。对此，Google 也在官宣公告中解释称，Gemma 设计的灵感就是来源于 Gemini，拉丁语 Gemma，有“宝石”之意。二者之间稍有不同的是：

可以将 Gemma 视为 Gemini 的更小、更轻的版本。
Gemma 的设计目的是让开发人员和研究人员更容易访问和使用，而 Gemini 的设计目的是用于更复杂的任务。
两种型号均可免费使用，但 Gemma 的免费套餐更为有限。

更为重要的是，Gemma 模型可以在台式机或者笔记本电脑上本地运行。

Gemma 是什么？

整体来看，Gemma 是由 Google DeepMind 和其他 Google AI 团队共同开发而成，采用与 Gemini 模型相同的研究和技术，建立在序列模型、Transformer、基于神经网络的深度学习方法和分布式系统上大规模训练技术至上。模型训练的上下文长度为 8192 个 token。

这款最新的模型有两种尺寸，一个是 Gemma 2B（20 亿参数），另一个是 Gemma 7B（70 亿参数）。每种尺寸都发布了预训练和指令调整变体。

模型权重将以许可商业授权的方式发布，同时 Google 也会发布一个新的负责任的生成式人工智能工具包，指导开发者、研究人员负责任地使用 Gemma 模型。

在 AI 中，参数是神经网络中确定 AI 模型行为的值，权重是存储在文件中的这些参数的子集。

Gemma 的发布，也是 Google 自 2022 年 OpenAI 推出 ChatGPT 以来发布的首个开放式 LLM，但这并不是 Google 对开放式 AI 研究的第一个贡献。在官方博客中，Google AI 团队表示，其在过去带来了 Transformers、TensorFlow、BERT、T5、JAX、AlphaFold 和 AlphaCode 等重要的 AI 架构和工具集。

所以这一次，其也为所有主要框架提供推理和监督微调 (SFT) 工具链：JAX、PyTorch 和 TensorFlow（通过本地 Keras 3.0）。

还有随时可用的 Colab 和 Kaggle 笔记本，以及与 Hugging Face、MaxText 和 NVIDIA NeMo 和 TensorRT-LLM 等流行工具进行了集成，方便开发者更容易上手使用 Gemma。

经过预训练和指令调整的 Gemma 模型可在笔记本电脑、工作站或 Google Cloud 上运行，并能够部署在 Vertex AI 和谷歌 Kubernetes Engine 上。

除此之外，英伟达在今天宣布与 Google 合作，在包括本地 RTX AI PC 在内的所有英伟达 AI 平台上启动优化，用来加速 Gemma 的性能。

同尺寸下，最先进的性能

当然新模型的发布，难免要和业界已存在的大模型一较高下。Google 在发布一份 16 页的 Gemma 技术报告时，将其与 Meta 的 LLaMA 2（7B）、LLaMA 2（13B），以及 Mistral（7B）进行了性能对比。

Google 表示，“Gemma 2B 和 7B 与其他开放式模型相比，在其规模上实现了同类最佳的性能。”

Gemma 技术报告评测结果如下：

从学术基准角度来看，Gemma 7B 在数学、Python 代码生成、常识和常识推理任务的几个基准测试中，优于 Meta 的 Llama 2 7B 和 13B 模型。

详细来看，在 MMLU 基准测试中，Gemma 7B 模型不仅超过了所有规模相同或更小的开源模型，还超过了一些更大的模型，包括 Llama 2 13B。

Google：Gemma 是负责任的设计

对于 AI 模型的发布，Google 一直采取比较谨慎的态度。

这一次，Google 也特别强调，「Gemma 的设计是将 AI 原则放在首位。为了使 Gemma 预训练模型安全可靠，Google 使用自动化技术从训练集中过滤掉某些个人信息和其他敏感数据。此外，他们还使用了大量的微调和人类反馈强化学习（RLHF），使指令调整模型与负责任的行为保持一致。为了了解并降低 Gemma 模型的风险，我们进行了严格的评估，包括人工红队、自动对抗测试和危险活动模型能力评估。」

此外，Google 还与 Gemma 一起发布了新的《负责任的生成式人工智能工具包》（https://ai.google.dev/responsible），以帮助开发人员和研究人员优先构建安全、负责任的人工智能应用。该工具包包括：

安全分类：发布 codelab（https://codelabs.developers.google.com/codelabs/responsible-ai/agile-classifiers），可使用最少的示例构建稳健的安全分类器。
调试：带来最新的模型调试工具 LIT（https://codelabs.developers.google.com/codelabs/responsible-ai/lit-gemma#0），可帮助开发者调查 Gemma 的行为并解决潜在问题。
指导：你可以根据 Google 在开发和部署大型语言模型方面的经验，获取模型构建者的最佳实践。

开放模型并不是指开源

最后，在很多专家学者来看，开源和开放权重的人工智能模型是确保聊天机器人透明度和隐私的重要步骤。

不过在发布 Gemma 之际，Google 特别强调了开源和开放模型的区别。其表示，“开放源代码的一个好处是，一旦发布，许可证就赋予用户完全的创作自主权。这为开发人员和最终用户获取技术提供了有力保障。另一个好处是，开放源码技术可以不受限制地进行修改，以适应最终用户的独特使用情况。”

但是 Gemma 遵循的规则是「开放模型」而非开源。开放模型的特点是可以免费获取模型权重，但使用、再分发和变体所有权的条款根据模型的具体使用条款而有所不同，这些条款可能不是基于开源许可证。

Gemma 模型的使用条款规定，个人开发者、研究人员和商业用户均可自由访问和重新分配这些模型。用户还可自由创建和发布模型变体。在使用 Gemma 模型时，开发者同意避免有害使用，这体现了 Google 对负责任地开发人工智能的承诺，同时也增加了对这项技术的使用。

之所以不用开源一词来形容 Gemma 的属性，在 Google 看来，现有的开源概念并不总能直接应用于 AI 系统，这就提出了如何在人工智能中使用开源许可证的问题。Google 所需要做的是，要澄清开源 AI 的概念，并解决衍生作品和作者归属等概念。

Gemma 这个名字，让你感到混乱吗？

Gemma 一经发布，便受到了不少 AI 从业者的关注，也有不少的媒体将其解读为 Google 正面叫板 Meta 的 LLama。

从体验上来看，网友在 X 社交平台上分享了其用 ollama 在 Macbook Pro M1 Max 32G 上安装了 Google 刚刚开源的 LLM gemma-7b，并直言“gemma-7b 的速度好过 Llama 13 B”。

以下是他的一个测试示例：

Google炸场！最强轻量级、开放模型Gemma发布，个人PC就能用，内部员工：强是强，但名字取得让我混乱！

对 Gemma 感兴趣的小伙伴，现在可以直接通过 Gemma（https://ai.google.dev/gemma）上手体验。

最后，鉴于过去的三个月里，Google 先是推出了，而后干掉了 Bard 品牌名并将其改名为 Gemini，进而推出了更好的版本 Gemini Advanced（可以看做是 ChatGPT Plus 的付费服务；不要与 Gemini Ultra 混淆，这一模型可以视为对标 OpenAI 的 GPT-4）。

不久之后，Google 又推出了另一个改进版本 Gemini 1.5，带来了 Gemini for Workspace。也有媒体报道，Google 内部还开发了一款“Gemini 的后代”——Goose，仅供内部使用，帮助员工更快地编写代码。

面对层出不穷 G 打头阵的名字，据 Business Insider 报道，就连 Google 内部员工都已被“逼疯”，各种内部员工吐槽的表情包涌现出来，发出“哪位 VP 的 OKRs 是以 Al 产品名称的数量来衡量的？”的质疑：

至此，你能准确分得清 Google 的各种模型吗？对最新发布的开放模型 Gemma 又有何看法？欢迎留言分享。