黄仁勋前脚刚盛赞DeepSeek，接着就发布号称可以秒杀DeepSeek一款新推理模型！|deepseek|gpu|国际消费电子展|推理|英伟达|黄仁勋

中生代大白

读完需要

分钟

速读仅需 1 分钟

在 2025 年 GTC 大会上，英伟达 CEO 黄仁勋展示了多项人工智能领域的最新技术突破。虽然他盛赞了 DeepSeek，但英伟达通过一系列从硬件到软件的创新成果，这些成果号称可以在推理性能上超越 DeepSeek!

Blackwell Ultra GPU：

英伟达正式发布了 Blackwell Ultra（GB300）芯片，这是一款面向 AI 推理时代的旗舰级 GPU 平台。GB300 NVL72 相较 GB200 NVL72 的 AI 性能提升 1.5 倍，HGX B300 NVL16 相较 Hopper 代际产品，在大语言模型推理方面，推理速度提高 11 倍、计算能力提升 7 倍、内存容量扩大 4 倍。整体而言，该芯片专为大规模推理场景设计，支持 72 颗 GPU 互联的 NVL72 超节点架构，在复杂推理任务中较传统 8 卡服务器性能提升显著。

推理框架 NVIDIA Dynamo：

英伟达推出了 AI 推理服务软件 —— 推理框架 NVIDIA Dynamo。它通过协调并加速数千颗 GPU 之间的推理通信，采用分离式推理架构，使大语言模型的输入处理和推理生成分别在不同 GPU 上运行，这样可以让每个阶段根据自身需求进行独立优化，确保 GPU 资源的最大化利用，从而实现更高效的 AI 推理计算。测试显示，Dynamo 可将大语言模型推理的 token 生成效率提升 3 倍，显著降低单位算力成本。

创造 DeepSeek - R1 推理性能世界纪录：

英伟达利用单个配备八块 Blackwell 架构 B200 GPU 的英伟达 DGX 系统，在 “超大规模、最先进的”DeepSeek - R1 模型上，实现每用户每秒可处理超过 250 个 token 的性能，或每秒最大吞吐量超过 30000 个 token。并且英伟达声称，随着 Blackwell Ultra GPU 和 Blackwell GPU 在推理性能上的突破，纪录还将继续刷新。自 1 月以来，DeepSeek - R1 671B 模型的吞吐量已被提高了约 36 倍，相当于每 token 的成本降低了约 32 倍。

同时英伟达还发布了两款桌面级 AI 设备 ——DGXSpark 与 DGXStation，将原本局限于数据中心的算力延伸至边缘端，大幅降低模型部署成本，契合 DeepSeek 等端侧模型优化趋势。同时，英伟达与台积电联合开发的 CPO 交换机，采用硅光子技术将光模块直接集成至芯片，较传统可插拔光模块降低 40% 功耗，带宽密度提升 1.6 倍，为百万 GPU 级 AI 工厂提供了网络基础设施新范式。

DeepSeek 是一家 2023 年成立于中国杭州的初创公司，其母公司是 High - Flyer 量化对冲基金。2025 年 1 月，DeepSeek 推出的推理模型在全球科技界引起巨大震动。有业内观点认为，DeepSeek 在受限芯片上创造出了与美国顶尖 AI 产品匹敌的技术成果，通过算法创新弥补了硬件不足，其表现超越了许多竞争对手，或与它们的许多能力相匹配。

DeepSeek 的崛起确实对包括 LLMA 在内的现有大型语言模型构成了一定的竞争和挑战，其在有限计算资源条件下实现的技术突破，让外界对中国 AI 的发展刮目相看，也促使整个行业重新对待 AI 发展对硬件的依赖以及算法创新的重要性。

另外，美国商务部正在调查 DeepSeek 是否通过第三方规避出口管制获取芯片，进一步加剧了两国在 AI 领域的紧张关系。同时，OpenAI 也提出新政策，将 DeepSeek 描述为 “被官方资助和控制的实体”，呼吁禁用中国 AI 模型，坦承 “美国领先优势正在缩小”。

◆ ◆ ◆ ◆ ◆

比亚迪亮出大杀器：兆瓦超充，充电5分钟跑400公里，油电同速！3万转高速电机只是配菜，重点是价格只有SU7 Ultra一半！

马斯克差点哭了！改革很艰难，已经没有回头路

华为基于5G跨越3000公里零延迟的远程人体手术震撼全球！网友点评：这个赛道应该没人来黑华为，没有友商，那是真安静！

华为海思自研麒麟X90芯片横空出世，有望打破WinTel垄断局面！网友点评：网上都在骂你，黑你，偏偏在中国你最争气

315后，千万女性网友再次呼吁雷军做卫生巾！小米之前回应做不了

继奥迪后，宝马也选择了和华为合作！BBA里就剩奔驰了！网友点评：大嘴爱吹牛，但得承认人家真有吹牛的底气