英伟达叫板DeepSeek？怒投260亿美元，要打造最强开源模型|deepseek|人工智能|开源模型|英伟达

编辑｜冷猫

昨天，我们报道了英伟达 CEO 黄仁勋的长博客。

在文中他认为，人工智能是当今塑造世界最强大的力量之一。它不是一个应用，也不是单一模型，而是如同电力和互联网一般的关键基础设施。

人工智能基础设施被分成了「五层蛋糕」能源 → 芯片 → 基础设施 → 模型 → 应用

事实上，英伟达本身已经成为了人工智能时代基础设施的一部分，尤其是芯片，以及「AI 工厂」类基础设施。

而黄老板的期待远不止如此，英伟达似乎正在尝试进入「五层蛋糕」的每一层。在 2023 年 11 月，英伟达推出首个Nemotron 模型，说明英伟达正式尝试进入通用大模型领域，开始尝试将 CUDA 生态与自研模型深度结合的路径。

Nemotron 系列模型尝试过很多技术路线，包括多种混合架构模型，有 Mamba-Transformer 的 Nemotron-H ，Llama-Nemotron，Jet-Nemotron 等等，一直到近期的混合专家架构的 Nemotron 3……

虽说英伟达在这些开源模型中不乏性能强大的模型，甚至站在过开源模型的第一梯队，但大家都能看出 Nemotron 似乎总带着点技术试验的底色。

不过，英伟达在开源模型研究上是认真的。

据 2025 年的一份财务文件显示，英伟达将在未来五年内投入 260 亿美元用于构建开源人工智能模型

据《WIRED》杂志报道，英伟达高管证实了这一此前从未被报道过的消息。

大家都说英伟达是「淘金热里买铲子」的聪明人。但这笔巨额投资预示着英伟达正经历一场蜕变。当买铲子的人下场淘金，是为了更好地卖铲子，还是希望彻底占据这片金矿？

周三，英伟达发布了其迄今为止性能最强的开源模型 Nemotron 3 Super。该模型拥有 1280 亿个参数，这使其在体量上大致等同于 OpenAI 旗下的最大版本 GPT-OSS。英伟达声称该模型在多项基准测试中的表现均优于 GPT-OSS 及其他同类模型。

「英伟达正在以更加严肃的态度对待开源模型的开发，并正在取得进步。」英伟达应用深度学习研究副总裁布莱恩・卡坦扎罗（Bryan Catanzaro）表示。

不过，英伟达正式投入开源模型研发的事情仍然有些让人费解。

针对这个问题，英伟达企业级生成式 AI 软件副总裁卡里・布里斯基（Kari Briski）给出了答案。

英伟达未来的 AI 模型不仅能够帮助公司改进芯片，还将提升其构建的超算级数据中心。她说：「我们构建模型是为了突破系统的极限，这不仅是为了测试计算能力，还包括存储和网络，并以此来构建我们的硬件架构路线图。」

除此以外，目前的前沿领先开源模型几乎都集中在中国。包括 DeepSeek、Qwen、月之暗面、智谱以及 MiniMax 等等许多中国顶尖模型都选择了免费且开放权重。

因此，全球许多初创公司和研究人员目前都在基于中国模型进行开发。这或许是英伟达投入开放权重大模型研发的重要驱动力之一。

计算机科学家、致力于推动 AI 开放性的非营利组织 Laude Institute 负责人安迪・康温斯基（Andy Konwinski）认为，「（英伟达）处于众多开源和闭源 AI 工作的最前沿，」康温斯基表示，「这是他们对开放抱有信念的空前信号。」

英伟达从算力供应商向全栈 AI 巨头的战略转型，其目标直指 OpenAI 和 DeepSeek 所在的前沿模型领域。

这种「以模型带硬件」的策略，通过对底层芯片能力的极致优化能力，旨在全球 AI 基础设施竞争中，进一步加固其在 AI 算力霸权上的护城河。

https://www.wired.com/story/nvidia-investing-26-billion-open-source-models/

英伟达叫板DeepSeek？怒投260亿美元，要打造最强开源模型

热搜

热门跟贴

热搜

热门跟贴

相关推荐

1000 倍效率神话，Taalas如何用 “模型即芯片” 暴打英伟达

英伟达与Thinking Machines Lab达成多年战略合作

英伟达的盲区，恰恰是华为的战机

抄袭英伟达？这家“中国英伟达”上市即炸场，3000亿市值谁在狂欢

中国版英伟达诞生，全自研技术引领国产替代崛起

英伟达成功，美国人反思：太多印度人当高管，除了吹牛啥也不会

德州仪器与英伟达合作加速人形机器人安全部署

全球AI APP100强出炉，中国力量崛起，DeepSeek位列全球第4

惠州老板进入英伟达供应链，搭上黄仁勋干出1900亿电路板王国

16岁上中科大，31岁造出“中国芯”，如今他正单挑英伟达！

英伟达CEO黄仁勋 ：中国AI市场无论有没有英伟达都会进步！

研报 | 英伟达算力架构为Scale-Up光互连发展铺路，预估CPO于AI数据中心渗透率将逐年提升

英伟达豪掷260亿美元下场造AI模型，直接叫板OpenAI

黄仁勋罕见发博文：AI的“五层蛋糕”

2017，制造奥本海默

探索国产芯片+国产整机+超算互联网算力资源 这场“养龙虾”活动在成都高新区举行

大模型的下半场，属于拥有云+AI全栈引擎的玩家

拒绝智能手机，炮轰ChatGPT，没有他就没有今天的互联网

OpenClaw最强科普，看完就真会玩龙虾了

黄仁勋，投了俄罗斯马云

英伟达CEO黄仁勋：中国AI市场无论有没有英伟达都会进步！

探索国产芯片+国产整机+超算互联网算力资源这场“养龙虾”活动在成都高新区举行