全球观察者深度出品
纵横寰宇,洞察时代风云
大家好欢迎收看【】
英伟达最近搞了个大动作,20年来最大规模的CUDAToolkit13.1更新来了。
这个被寄予厚望的软件升级,本想巩固英伟达在AI芯片领域的霸主地位,没想到却引发了一场行业大讨论。
CUDA更新,是护城河还是定时炸弹?
这次更新最核心的是引入了CUDATile编程模型,简单说就是让开发者写代码更容易了。
以前GPU编程门槛高得吓人,现在普通人稍微学学也能上手。
英伟达算盘打得挺精,觉得这样能吸引更多人用自己的生态,毕竟开发者多了,硬件销量自然不愁。
但传奇芯片架构师吉姆·凯勒不这么看。
他最近放话说,这个Tile模型可能会让英伟达的软件护城河彻底崩塌。
为啥呢?因为这种图块化技术早就不是啥新鲜事了,像Triton框架里就有类似玩法。
要是CUDA代码更容易移植到其他框架,那AMD这些竞争对手岂不是捡了个大便宜?开发者想换芯片就换,英伟达还怎么锁死用户?
行业里对这事的看法分裂得厉害。
有分析师觉得凯勒是杞人忧天,CUDATile虽然表面上简化了编程,但底层的中间表示还是针对英伟达硬件深度优化的。
这就好比给你一把万能钥匙,看着能开很多锁,实际上只能开他家的门。
英伟达这波操作,说是降低门槛,不如说是换个姿势把开发者绑得更紧。
英伟达现在的处境挺微妙的。
AI大模型对算力的胃口越来越大,开发者天天喊着要简化编程。
不升级CUDA吧,怕开发者被竞争对手抢走;升级了又怕把门缝开太大,让对手有机可乘。
这种技术和市场的平衡术,玩好了是神操作,玩砸了可就麻烦了。
大客户“叛逃”+中国市场遇冷,英伟达有点慌
就在CUDA更新引发争议的时候,英伟达的大客户们也开始搞事情。
谷歌最新发布的Gemini3大模型,性能据说比GPT还强,最关键的是没用英伟达GPU,全靠自家TPU搞定。
这可不是小打小闹,谷歌用实际行动证明,离开英伟达照样能玩得转。
更要命的是成本问题。
有消息说用TPU训练Gemini3,成本比用英伟达方案直接砍半。
企业又不傻,能省一半钱谁不乐意?Meta最近也放风说要考虑用谷歌的AI芯片,这可都是英伟达的老客户。
以前大家没得选,只能乖乖掏钱买GPU,现在有了替代方案,谁还愿意当冤大头?
这背后其实是AI芯片市场的风向变了。
以前英伟达靠通用GPU和CUDA生态躺着赚钱,现在大模型训练流程越来越标准化,专用芯片的春天来了。
谷歌TPU、特斯拉D1、亚马逊Trainium,一个个都想从英伟达嘴里抢肉吃。
客户们也学聪明了,一边用着英伟达的芯片,一边偷偷搞自研,就怕哪天被卡脖子。
英伟达当然不会坐以待毙。
最近开始推出针对特定行业的定制GPU,想靠差异化留住客户。
但这招能管用多久?毕竟客户要的是成本可控和供应链自主,不是换汤不换药的新包装。
中国市场这边,英伟达更是头疼。
特朗普最近说要允许英伟达卖H200芯片给中国,但得抽走25%的收入。
这条件谁能接受?黄仁勋自己都没底,公开说不确定中国会不会买。
想想也是,谁愿意花高价买个被人抽成的产品?
更何况之前还出过芯片“后门”的事,中国客户对英伟达的信任度早就打了折扣。
现在国产芯片也起来了,华为昇腾性能跟英伟达A100差不了多少,价格还便宜,关键是安全可控。
黄仁勋自己都承认,美国低估了中国芯片产业的发展速度。
现在中国每年能生产几百万颗AI芯片,英伟达想再靠减配版产品赚大钱,怕是没那么容易了。
英伟达现在就像走钢丝,一边是CUDA生态可能出现的裂痕,一边是大客户和中国市场的双重压力。
20年建立起来的霸权,在2024年遇到了真正的挑战。
这场仗该怎么打,黄仁勋怕是头发都要愁白了。
毕竟在科技圈,没有谁能永远躺着赚钱,逆水行舟不进则退,这个道理英伟达比谁都清楚。
热门跟贴