打开网易新闻 查看精彩图片

全球观察者深度出品

纵横寰宇,洞察时代风云

大家好欢迎收看【】

英伟达最近搞了个大动作,20年来最大规模的CUDAToolkit13.1更新来了。

这个被寄予厚望的软件升级,本想巩固英伟达在AI芯片领域的霸主地位,没想到却引发了一场行业大讨论。

CUDA更新,是护城河还是定时炸弹?

打开网易新闻 查看精彩图片

这次更新最核心的是引入了CUDATile编程模型,简单说就是让开发者写代码更容易了。

以前GPU编程门槛高得吓人,现在普通人稍微学学也能上手。

英伟达算盘打得挺精,觉得这样能吸引更多人用自己的生态,毕竟开发者多了,硬件销量自然不愁。

但传奇芯片架构师吉姆·凯勒不这么看。

打开网易新闻 查看精彩图片

他最近放话说,这个Tile模型可能会让英伟达的软件护城河彻底崩塌。

为啥呢?因为这种图块化技术早就不是啥新鲜事了,像Triton框架里就有类似玩法。

要是CUDA代码更容易移植到其他框架,那AMD这些竞争对手岂不是捡了个大便宜?开发者想换芯片就换,英伟达还怎么锁死用户?

打开网易新闻 查看精彩图片

行业里对这事的看法分裂得厉害。

有分析师觉得凯勒是杞人忧天,CUDATile虽然表面上简化了编程,但底层的中间表示还是针对英伟达硬件深度优化的。

这就好比给你一把万能钥匙,看着能开很多锁,实际上只能开他家的门。

打开网易新闻 查看精彩图片

英伟达这波操作,说是降低门槛,不如说是换个姿势把开发者绑得更紧。

英伟达现在的处境挺微妙的。

AI大模型对算力的胃口越来越大,开发者天天喊着要简化编程。

不升级CUDA吧,怕开发者被竞争对手抢走;升级了又怕把门缝开太大,让对手有机可乘。

打开网易新闻 查看精彩图片

这种技术和市场的平衡术,玩好了是神操作,玩砸了可就麻烦了。

大客户“叛逃”+中国市场遇冷,英伟达有点慌

就在CUDA更新引发争议的时候,英伟达的大客户们也开始搞事情。

谷歌最新发布的Gemini3大模型,性能据说比GPT还强,最关键的是没用英伟达GPU,全靠自家TPU搞定。

打开网易新闻 查看精彩图片

这可不是小打小闹,谷歌用实际行动证明,离开英伟达照样能玩得转。

更要命的是成本问题。

有消息说用TPU训练Gemini3,成本比用英伟达方案直接砍半。

企业又不傻,能省一半钱谁不乐意?Meta最近也放风说要考虑用谷歌的AI芯片,这可都是英伟达的老客户。

打开网易新闻 查看精彩图片

以前大家没得选,只能乖乖掏钱买GPU,现在有了替代方案,谁还愿意当冤大头?

这背后其实是AI芯片市场的风向变了。

以前英伟达靠通用GPU和CUDA生态躺着赚钱,现在大模型训练流程越来越标准化,专用芯片的春天来了。

谷歌TPU、特斯拉D1、亚马逊Trainium,一个个都想从英伟达嘴里抢肉吃。

打开网易新闻 查看精彩图片

客户们也学聪明了,一边用着英伟达的芯片,一边偷偷搞自研,就怕哪天被卡脖子。

英伟达当然不会坐以待毙。

最近开始推出针对特定行业的定制GPU,想靠差异化留住客户。

但这招能管用多久?毕竟客户要的是成本可控和供应链自主,不是换汤不换药的新包装。

中国市场这边,英伟达更是头疼。

打开网易新闻 查看精彩图片

特朗普最近说要允许英伟达卖H200芯片给中国,但得抽走25%的收入。

这条件谁能接受?黄仁勋自己都没底,公开说不确定中国会不会买。

想想也是,谁愿意花高价买个被人抽成的产品?

更何况之前还出过芯片“后门”的事,中国客户对英伟达的信任度早就打了折扣。

现在国产芯片也起来了,华为昇腾性能跟英伟达A100差不了多少,价格还便宜,关键是安全可控。

打开网易新闻 查看精彩图片

黄仁勋自己都承认,美国低估了中国芯片产业的发展速度。

现在中国每年能生产几百万颗AI芯片,英伟达想再靠减配版产品赚大钱,怕是没那么容易了。

英伟达现在就像走钢丝,一边是CUDA生态可能出现的裂痕,一边是大客户和中国市场的双重压力。

打开网易新闻 查看精彩图片

20年建立起来的霸权,在2024年遇到了真正的挑战。

这场仗该怎么打,黄仁勋怕是头发都要愁白了。

毕竟在科技圈,没有谁能永远躺着赚钱,逆水行舟不进则退,这个道理英伟达比谁都清楚。