当老黄颇为自恋地问观众,“我这件皮衣怎么样?”我就知道这场发布会不简单。
游戏玩家最为关心得为英伟达献出多少大洋,黄仁勋却寥寥几页带过了消费级显卡,把大段叙述留给了AI,以及智能体、世界模型、机器人、自动驾驶、超算等因AI渗透发生进展的领域,未来又将如何被英伟达改变。
RTX50系,刺得我好痛
老黄一上来,就带我们短暂回顾了英伟达的历史,如何从《街头霸王》走向图像处理领域的巨头,GPU也从游戏图像处理的芯片,成为了AI的支柱。
老黄先是端出,新一代基于Blackwell架构的GeForceRTX50系显卡。
从技术规格来看,RTX5090搭载920亿个晶体管,可提供3400TOPS算力,还带四个AI处理单元,内建21760个CUDA核心,是世界上第一款超过20000个内核的GeForceGPU,512bit位宽32GBGDDR7的显存,整体性能是RTX4090的两倍。
换芯后的RTX50诠释了老黄口中,“GeForce曾让AI触达大众,而AI“卷土重来”后,彻底改变GeForce”。
而老黄将RTX4090价格砍了三分之二,“摇身一变”,RTX5070登场。售价549美元的RTX5070性能等同于2022年发布,售价1599美元的4090。台下瞬间爆发热烈掌声。
在一头一尾两张卡介绍完后,中间的RTX5070Ti和5080沦为了“背景版”。Blackwell已全面投产,RTX50系也将于一月开始发售。
有人收我双十一5500买的4070TiS吗?
”大力水手“第四代DLSS正式登场,引入了多帧生成技术,用AI把每个渲染帧再生成三帧,从DLSS3的一比一生成,直接进化到“以一生三”。
DLSS4最高可以实现传统渲染8倍的性能,同时比旧版生成速度快40%,生成的像素重影更少,细节更多,整体视觉效果更清晰。
然而,DLSS4仅供RTX50系使用,首发即支持75款主流3A大作,其他游戏将在后续支持(不知道你们,双十一我刚花5500买的4070TiS,这会儿心痛痛的)。英伟达宣布:RTX5090将带游戏进入4K240帧光线追踪的时代。
备受游戏玩家关注的RTX50系的发布环节,大概十多分钟左右就结束了。
不是?这就结束了?
2021年(自然年),游戏还是英伟达最大的收入来源,约为122亿美元,占比46.7%。而2022年后,英伟达的数据中心业务直接起飞。据彭博社对英伟达2025年的销售预估,游戏业务没发生太大变化,能达到118亿美元的销售额,对应的数据中心则是1137亿美元。
游戏代表英伟达的过去,而AI才是未来。
AI要理解物理世界
模型性能与数据可用性直接相关,但物理世界数据的捕获、整理、和标记成本很高。此前,业内也普遍认为,AI向前发展面临“数据墙”的问题。
英伟达对此表示:没有数据,就创造数据。英伟达发布了Cosmos世界基础模型(WorldFoundationModels),要教AI理解物理世界。
老黄特意说,Cosmos模型不是教AI生成创意内容,换个意思,跟市面上那些“花里胡哨”的视频模型不太一样。
Cosmos用文本指令就能生成符合物理规律的高质量视频,再通过对已有的视频分析,生成极度拟真的视频,再用AI分析AI视频,这就相当于自己出题自己做,卷死自己谁能活?
据介绍,Cosmos的第一代已经用9000万亿Token进行了训练,深度学习了2000万小时的人类高质量视频(这时长相当于从秦始皇登基前开始看视频,一直看到今天发布会)。
然后老黄大手一挥表示,Cosmos模型开源,在Github上就能访问(已于下午14:20上线)。毕竟,独乐乐不如众乐乐。
这跟之前叫嚷很久的Omniverse数字孪生平台联系了起来。
Omniverse(工业数字化和物理AI仿真平台,内置了英伟达PhysX、RTX技术,可以实现物理上3D场景搭建,并且其中有真实的碰撞、光线追踪和粒子模拟)为Cosmos生成提供了一个能落地、可控制、可调节的基础环境。
比如,Omniverse中构建一个车祸场景(总不能为了AI训练一直故意制造车祸吧),Cosmos模型来渲染和分析场景里的物理规律,例如当开发者输入不同指令,“变成夜晚都市高峰期的路况”、“测试车辆左边加一辆要左转的车”、“前面的摩托车闯红灯”等,Cosmos生成“花式路况”让AI不断学习升级——有点”自产自销“的意思。
老黄说,构建机器人系统得要三台计算机。一个用来训练,和一个用来部署,还有一个得把前面两个连接起来,这就是Omniverse和Cosmos这套组合拳的意义,用合成数据去训练模型,给机器人系统提供仿真环境不停做测试。
当然,机器人系统可以是自动驾驶汽车,更可以是“机器人”。
欢迎老黄的朋友们。
可恶,被他装到了
一排十几个人形机器人,从台下依次升起。几次颇为寂静和稀稀拉拉的掌声后,场内终于一片叫好。IsaacGR00T是人形机器人通用基础模型,在最新版本里,开发者头戴VisionPro拍摄第一人称视频,来教机器人怎么识别物理空间,怎么做出自然动作。
全球最小的个人超算
当老黄“举”着BlackwellNVLink72样品上台时,不知道是“美国队长”的造型不太适合他,还是产品使用离用户太远,反正,老黄看起来没收到想象中的喝彩声。
不是,你AI队长啊?
NVLink72能将模型训练成本降低三倍,配备了72个BlackwellGPU、1.4exaFLOPS算力和130万亿个晶体管,能满足几乎所有数据中心的需求。
AI将会持续scale(不管以哪种方式),是英伟达推出NVlink72的原因。
一切都要从DGX-1(首个专为深度学习而设计的系统)说起。2016年,黄把第一台DGX-1送给了OpenAI和马斯克,坊间到处流传着那张照片。
“那台机器要是能小点儿就好了”,话音刚落,Keynote里的样机成倍缩小,全球最小的个人AI超级计算机ProjectsDigits登场。
可恶,又被他装到了
ProjectsDigits,巴掌大的超级计算机,和一本新华词典差不多的体积下,配备128GB统一内存和4TB的NVMe存储,还搭载了GB10GraceBlackwell芯片,本地就能跑2000亿参数的大模型,这算力还不够的话,可以买两台连接达到4050亿参数的模型(刚好符合Meta最新的Llama-3.1最大尺寸模型参数量)。
标准电源插座就能带动ProjectsDigits,用户基于自己的桌面系统就能开发和测试模型,而且都基于Blackwell架构,开发者还能在英伟达的云端或数据中心上无缝部署模型。
相当于电费、服务器、硬件成本,甚至占用空间都给你省出来了。不过ProjectsDigits也不算便宜,起售价3000美元(约人民币22000元),5月正式上市。
至此,关于新品介绍完毕。
现场偶有冷场发生,并不是老黄不够幽默。而是CES本是一个消费硬件扎堆的“大联欢”,而英伟达的发布会重心明显从消费级产品,转向行业解决方案,如果你细心,就能看到每个产品后的keynote上列出的满满“友商”。
而面向AI时代的硬件,将AI催生的生产力再向上推高一个台阶,或许也是这一届CES的主旋律。
热门跟贴