中生代大白

读完需要

3

分钟

速读仅需 1 分钟

在 2025 年 GTC 大会上,英伟达 CEO 黄仁勋展示了多项人工智能领域的最新技术突破。虽然他盛赞了 DeepSeek,但英伟达通过一系列从硬件到软件的创新成果,这些成果号称可以在推理性能上超越 DeepSeek!

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

Blackwell Ultra GPU:

英伟达正式发布了 Blackwell Ultra(GB300)芯片,这是一款面向 AI 推理时代的旗舰级 GPU 平台。GB300 NVL72 相较 GB200 NVL72 的 AI 性能提升 1.5 倍,HGX B300 NVL16 相较 Hopper 代际产品,在大语言模型推理方面,推理速度提高 11 倍、计算能力提升 7 倍、内存容量扩大 4 倍。整体而言,该芯片专为大规模推理场景设计,支持 72 颗 GPU 互联的 NVL72 超节点架构,在复杂推理任务中较传统 8 卡服务器性能提升显著。

打开网易新闻 查看精彩图片

推理框架 NVIDIA Dynamo:

英伟达推出了 AI 推理服务软件 —— 推理框架 NVIDIA Dynamo。它通过协调并加速数千颗 GPU 之间的推理通信,采用分离式推理架构,使大语言模型的输入处理和推理生成分别在不同 GPU 上运行,这样可以让每个阶段根据自身需求进行独立优化,确保 GPU 资源的最大化利用,从而实现更高效的 AI 推理计算。测试显示,Dynamo 可将大语言模型推理的 token 生成效率提升 3 倍,显著降低单位算力成本。

打开网易新闻 查看精彩图片

创造 DeepSeek - R1 推理性能世界纪录:

英伟达利用单个配备八块 Blackwell 架构 B200 GPU 的英伟达 DGX 系统,在 “超大规模、最先进的”DeepSeek - R1 模型上,实现每用户每秒可处理超过 250 个 token 的性能,或每秒最大吞吐量超过 30000 个 token。并且英伟达声称,随着 Blackwell Ultra GPU 和 Blackwell GPU 在推理性能上的突破,纪录还将继续刷新。自 1 月以来,DeepSeek - R1 671B 模型的吞吐量已被提高了约 36 倍,相当于每 token 的成本降低了约 32 倍。

同时英伟达还发布了两款桌面级 AI 设备 ——DGXSpark 与 DGXStation,将原本局限于数据中心的算力延伸至边缘端,大幅降低模型部署成本,契合 DeepSeek 等端侧模型优化趋势。同时,英伟达与台积电联合开发的 CPO 交换机,采用硅光子技术将光模块直接集成至芯片,较传统可插拔光模块降低 40% 功耗,带宽密度提升 1.6 倍,为百万 GPU 级 AI 工厂提供了网络基础设施新范式。

DeepSeek 是一家 2023 年成立于中国杭州的初创公司,其母公司是 High - Flyer 量化对冲基金。2025 年 1 月,DeepSeek 推出的推理模型在全球科技界引起巨大震动。有业内观点认为,DeepSeek 在受限芯片上创造出了与美国顶尖 AI 产品匹敌的技术成果,通过算法创新弥补了硬件不足,其表现超越了许多竞争对手,或与它们的许多能力相匹配。

DeepSeek 的崛起确实对包括 LLMA 在内的现有大型语言模型构成了一定的竞争和挑战,其在有限计算资源条件下实现的技术突破,让外界对中国 AI 的发展刮目相看,也促使整个行业重新对待 AI 发展对硬件的依赖以及算法创新的重要性。

另外,美国商务部正在调查 DeepSeek 是否通过第三方规避出口管制获取芯片,进一步加剧了两国在 AI 领域的紧张关系。同时,OpenAI 也提出新政策,将 DeepSeek 描述为 “被官方资助和控制的实体”,呼吁禁用中国 AI 模型,坦承 “美国领先优势正在缩小”。

◆ ◆ ◆ ◆ ◆

比亚迪亮出大杀器:兆瓦超充,充电5分钟跑400公里,油电同速!3万转高速电机只是配菜,重点是价格只有SU7 Ultra一半!

马斯克差点哭了!改革很艰难,已经没有回头路

华为基于5G跨越3000公里零延迟的远程人体手术震撼全球!网友点评:这个赛道应该没人来黑华为,没有友商,那是真安静!

华为海思自研麒麟X90芯片横空出世,有望打破WinTel垄断局面!网友点评:网上都在骂你,黑你,偏偏在中国你最争气

315后,千万女性网友再次呼吁雷军做卫生巾!小米之前回应做不了

继奥迪后,宝马也选择了和华为合作!BBA里就剩奔驰了!网友点评:大嘴爱吹牛,但得承认人家真有吹牛的底气