都知道英伟达厉害,是算力芯片之王。但它真正的护城河不是超大算力,而是软件生态。
如果只拼算力,AMD去年发布的MI300已经超越了英伟达H100,英特尔的Gaudi3号称比英伟达H200还快30%。但他们根本分不走英伟达的蛋糕,因为英伟达靠CUDA构建起一个软件生态。
有华尔街分析师说:如果英伟达真的有泡沫,也是因为CUDA的不可替代。
但是如今被捧上神坛的CUDA,曾让黄仁勋备受嘲讽。
讲CUDA之前,要先说清楚一个概念,英伟达开创的GPU是专项计算,性能强悍,但只能做图像加速,而英特尔的CPU是通用计算,十项全能,但速度比不上GPU。
黄仁勋的想法是,如果能用GPU搞通用计算,那岂不是既有速度又很全能吗?
想得美,既要又要,说得也容易,但操作难度相当大。
这时,黄仁勋遇到一个人才。他叫伊恩·巴克(Ian Buck),他2000年在斯坦福读研究生的时候,就把32张GeForce显卡连一起,用8台投影仪玩《雷神之锤》。
打游戏之余,他还破解了GeForce的编程工具着色器,一顿魔改后,又把它装到一台超级计算机里。
到2003年,伊恩正式发布Brook,这是第一个采用并行计算的编程模型,跟黄仁勋想一块去了。
天降奇才,必须拿下。
2004年,黄仁勋把伊恩招入麾下,让他负责研发更成熟的GPU编程模型。目标只有一个:让程序员人人用上GPU。预算随你用,管够。
2年后,CUDA诞生了。
通过CUDA,开发者可以把英伟达GPU的计算性能用到任何地方,几乎零门槛,因为CUDA从一开始就支持C语言。
老黄对CUDA相当满意,把它内置到几乎所有GPU里。
没想到这个动作差点把英伟达害死。
用CUDA编程是挺好,但市面上没需求,人家原来的工具用得好好的,干嘛要突然换一套呢?
开发者不想用,华尔街也不看好。他们对CUDA的估值为零,而且因为内置了CUDA,英伟达GPU的成本几乎翻倍,老黄又不敢提价,销量还不见涨,出力不讨好。
更尴尬的是,为了支持CUDA,英伟达在GPU中增加了逻辑电路,导致芯片的面积变大、散热量提高、故障率飙升。
CUDA发布2年后,英伟达市值下跌超过70%。
股东们都急疯了,纷纷找上门,要求黄仁勋停止开发CUDA,咱老老实实做游戏显卡不好吗?
黄仁勋抖抖皮衣,淡淡地说:我相信以后开发者会选择CUDA的。
其实不光是不懂技术的股东,就连英伟达首席深度学习研究员布莱恩(Bryan Catanzaro)也有点怀疑:老板,咱这事儿真靠谱吗?
但黄仁勋没动摇过,他坚信CUDA会引领超级计算的发展。这是改变世界的技术,砸多少钱都不亏。
他一度拿出英伟达营收的1/6投进CUDA项目,在CUDA发布后的10年,一共投了上百亿美元。
当然,作为CEO,他也不能只管砸钱。
为了推广CUDA,老黄到处找客户,股票交易员找过、石油勘探师找过、生物学家也找过。他们甚至给哈根达斯的母公司(通用磨坊)模拟过做披萨的热物理过程。
当然,这些都是杯水车薪。
直到2011年的一天,有位化学家给黄仁勋打电话,说我有好多计算任务,用普通电脑要两周才能算好,但我买了一堆 Geforce 580 装在电脑上,几个小时就搞定了。感谢黄老板,让我有了专属的超级计算机。
黄仁勋一想,对啊,科学计算本质上都是并行计算,用GPU正合适!
他赶紧通知CUDA团队,给我朝着科学计算猛攻!
到2012年,AI教父辛顿教授基于CUDA平台训练AI模型,拿下了国际图像识别大赛的冠军,深度学习瞬间就火了。
互联网大厂也反应过来了,他们天天都要处理海量数据,如果用CUDA,岂不是事半功倍吗?
内置了CUDA的英伟达GPU,从此成为抢手货。
尤其是CUDA的软件生态,已经拥有500多万开发者和数不清的用户,庞大的用户基础反过来降低了计算成本,形成正向循环。
说英伟达是一家依托硬件芯片的软件公司,也没啥问题。
这种模式也很普遍,我们最熟悉的是苹果手机,iPhone刚推出时吸引用户靠的是硬件创新,走向成熟后,iOS系统就成了最重要的护城河,现在华为、小米们也都在学这种模式。
但拥有软件生态也不能一劳永逸,今年8月,AMD豪掷49亿美元收购服务器制造商ZT,目标正是打造自己的软件生态,复刻一个“AMD版的英伟达”,你认为AMD能成功吗?来评论区聊聊。
作者 | 吴婷
参考资料:
[1]AMD死战CUDA:我是一家软件公司.51CTO.2024
[2]双面黄仁勋.深燃.2023
[3]没人能“杀死”1.5万亿美元的英伟达.腾讯科技.2023
热门跟贴