编辑|冷猫
昨天,我们报道了英伟达 CEO 黄仁勋的长博客。
在文中他认为,人工智能是当今塑造世界最强大的力量之一。它不是一个应用,也不是单一模型,而是如同电力和互联网一般的关键基础设施。
人工智能基础设施被分成了「五层蛋糕」能源 → 芯片 → 基础设施 → 模型 → 应用
事实上,英伟达本身已经成为了人工智能时代基础设施的一部分,尤其是芯片,以及「AI 工厂」类基础设施。
而黄老板的期待远不止如此,英伟达似乎正在尝试进入「五层蛋糕」的每一层。在 2023 年 11 月,英伟达推出首个Nemotron 模型,说明英伟达正式尝试进入通用大模型领域,开始尝试将 CUDA 生态与自研模型深度结合的路径。
Nemotron 系列模型尝试过很多技术路线,包括多种混合架构模型,有 Mamba-Transformer 的 Nemotron-H ,Llama-Nemotron,Jet-Nemotron 等等,一直到近期的混合专家架构的 Nemotron 3……
虽说英伟达在这些开源模型中不乏性能强大的模型,甚至站在过开源模型的第一梯队,但大家都能看出 Nemotron 似乎总带着点技术试验的底色。
不过,英伟达在开源模型研究上是认真的。
据 2025 年的一份财务文件显示,英伟达将在未来五年内投入 260 亿美元用于构建开源人工智能模型
据《WIRED》杂志报道,英伟达高管证实了这一此前从未被报道过的消息。
大家都说英伟达是「淘金热里买铲子」的聪明人。但这笔巨额投资预示着英伟达正经历一场蜕变。当买铲子的人下场淘金,是为了更好地卖铲子,还是希望彻底占据这片金矿?
周三,英伟达发布了其迄今为止性能最强的开源模型 Nemotron 3 Super。该模型拥有 1280 亿个参数,这使其在体量上大致等同于 OpenAI 旗下的最大版本 GPT-OSS。英伟达声称该模型在多项基准测试中的表现均优于 GPT-OSS 及其他同类模型。
「英伟达正在以更加严肃的态度对待开源模型的开发,并正在取得进步。」 英伟达应用深度学习研究副总裁布莱恩・卡坦扎罗(Bryan Catanzaro)表示。
不过,英伟达正式投入开源模型研发的事情仍然有些让人费解。
针对这个问题,英伟达企业级生成式 AI 软件副总裁卡里・布里斯基(Kari Briski)给出了答案。
英伟达未来的 AI 模型不仅能够帮助公司改进芯片,还将提升其构建的超算级数据中心。她说:「我们构建模型是为了突破系统的极限,这不仅是为了测试计算能力,还包括存储和网络,并以此来构建我们的硬件架构路线图。」
除此以外,目前的前沿领先开源模型几乎都集中在中国。包括 DeepSeek、Qwen、月之暗面、智谱以及 MiniMax 等等许多中国顶尖模型都选择了免费且开放权重。
因此,全球许多初创公司和研究人员目前都在基于中国模型进行开发。这或许是英伟达投入开放权重大模型研发的重要驱动力之一。
计算机科学家、致力于推动 AI 开放性的非营利组织 Laude Institute 负责人安迪・康温斯基(Andy Konwinski)认为,「(英伟达)处于众多开源和闭源 AI 工作的最前沿,」 康温斯基表示,「这是他们对开放抱有信念的空前信号。」
英伟达从算力供应商向全栈 AI 巨头的战略转型,其目标直指 OpenAI 和 DeepSeek 所在的前沿模型领域。
这种「以模型带硬件」的策略,通过对底层芯片能力的极致优化能力,旨在全球 AI 基础设施竞争中,进一步加固其在 AI 算力霸权上的护城河。
https://www.wired.com/story/nvidia-investing-26-billion-open-source-models/
热门跟贴