嘉宾商学吴婷：黄仁勋和CUDA的生死恋

嘉宾商学

2024-10-10 16:15 ·北京

都知道英伟达厉害，是算力芯片之王。但它真正的护城河不是超大算力，而是软件生态。

如果只拼算力，AMD去年发布的MI300已经超越了英伟达H100，英特尔的Gaudi3号称比英伟达H200还快30%。但他们根本分不走英伟达的蛋糕，因为英伟达靠CUDA构建起一个软件生态。

有华尔街分析师说：如果英伟达真的有泡沫，也是因为CUDA的不可替代。

但是如今被捧上神坛的CUDA，曾让黄仁勋备受嘲讽。

今天婷姐就来讲讲黄仁勋和CUDA之间的生死恋。

讲CUDA之前，要先说清楚一个概念，英伟达开创的GPU是专项计算，性能强悍，但只能做图像加速，而英特尔的CPU是通用计算，十项全能，但速度比不上GPU。

黄仁勋的想法是，如果能用GPU搞通用计算，那岂不是既有速度又很全能吗？

想得美，既要又要，说得也容易，但操作难度相当大。

这时，黄仁勋遇到一个人才。他叫伊恩·巴克（Ian Buck），他2000年在斯坦福读研究生的时候，就把32张GeForce显卡连一起，用8台投影仪玩《雷神之锤》。

打游戏之余，他还破解了GeForce的编程工具着色器，一顿魔改后，又把它装到一台超级计算机里。

到2003年，伊恩正式发布Brook，这是第一个采用并行计算的编程模型，跟黄仁勋想一块去了。

天降奇才，必须拿下。

2004年，黄仁勋把伊恩招入麾下，让他负责研发更成熟的GPU编程模型。目标只有一个：让程序员人人用上GPU。预算随你用，管够。

2年后，CUDA诞生了。

通过CUDA，开发者可以把英伟达GPU的计算性能用到任何地方，几乎零门槛，因为CUDA从一开始就支持C语言。

老黄对CUDA相当满意，把它内置到几乎所有GPU里。

没想到这个动作差点把英伟达害死。

用CUDA编程是挺好，但市面上没需求，人家原来的工具用得好好的，干嘛要突然换一套呢？

开发者不想用，华尔街也不看好。他们对CUDA的估值为零，而且因为内置了CUDA，英伟达GPU的成本几乎翻倍，老黄又不敢提价，销量还不见涨，出力不讨好。

更尴尬的是，为了支持CUDA，英伟达在GPU中增加了逻辑电路，导致芯片的面积变大、散热量提高、故障率飙升。

CUDA发布2年后，英伟达市值下跌超过70%。

股东们都急疯了，纷纷找上门，要求黄仁勋停止开发CUDA，咱老老实实做游戏显卡不好吗？

黄仁勋抖抖皮衣，淡淡地说：我相信以后开发者会选择CUDA的。

其实不光是不懂技术的股东，就连英伟达首席深度学习研究员布莱恩（Bryan Catanzaro）也有点怀疑：老板，咱这事儿真靠谱吗？

但黄仁勋没动摇过，他坚信CUDA会引领超级计算的发展。这是改变世界的技术，砸多少钱都不亏。

他一度拿出英伟达营收的1/6投进CUDA项目，在CUDA发布后的10年，一共投了上百亿美元。

当然，作为CEO，他也不能只管砸钱。

为了推广CUDA，老黄到处找客户，股票交易员找过、石油勘探师找过、生物学家也找过。他们甚至给哈根达斯的母公司（通用磨坊）模拟过做披萨的热物理过程。

当然，这些都是杯水车薪。

直到2011年的一天，有位化学家给黄仁勋打电话，说我有好多计算任务，用普通电脑要两周才能算好，但我买了一堆 Geforce 580 装在电脑上，几个小时就搞定了。感谢黄老板，让我有了专属的超级计算机。

黄仁勋一想，对啊，科学计算本质上都是并行计算，用GPU正合适！

他赶紧通知CUDA团队，给我朝着科学计算猛攻！

到2012年，AI教父辛顿教授基于CUDA平台训练AI模型，拿下了国际图像识别大赛的冠军，深度学习瞬间就火了。

互联网大厂也反应过来了，他们天天都要处理海量数据，如果用CUDA，岂不是事半功倍吗？

内置了CUDA的英伟达GPU，从此成为抢手货。

尤其是CUDA的软件生态，已经拥有500多万开发者和数不清的用户，庞大的用户基础反过来降低了计算成本，形成正向循环。

说英伟达是一家依托硬件芯片的软件公司，也没啥问题。

这种模式也很普遍，我们最熟悉的是苹果手机，iPhone刚推出时吸引用户靠的是硬件创新，走向成熟后，iOS系统就成了最重要的护城河，现在华为、小米们也都在学这种模式。

但拥有软件生态也不能一劳永逸，今年8月，AMD豪掷49亿美元收购服务器制造商ZT，目标正是打造自己的软件生态，复刻一个“AMD版的英伟达”，你认为AMD能成功吗？来评论区聊聊。

作者 | 吴婷

吴婷

参考资料：

[1]AMD死战CUDA：我是一家软件公司.51CTO.2024

[2]双面黄仁勋.深燃.2023

[3]没人能“杀死”1.5万亿美元的英伟达.腾讯科技.2023

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴