最近AI圈直接被炸得人仰马翻,梁文锋带队的DeepSeek扔出两个开源大模型,直接把海内外搞AI的都震麻了。谁能想到,做出这种顶尖水平的模型,只用了同行四分之一的GPU,十分之一的存储,性能还摸到了世界顶级闭源模型的门槛。这事一落地,之前黄仁勋罕见发飙的那番话,大伙瞬间就品出滋味了。
这两款新品一个叫V4 Flash,一个叫V4 Pro,放出来直接坐稳了目前最强开源AI的位置。推理性能把所有已知开源模型都甩在身后,知识储备跟谷歌Gemini Pro只差一丢丢,Agent能力更是创下史上最强纪录。DeepSeek内部已经用它做AI编程,体验超过了Claude Sonnet 4.5,交付质量接近Opus 4.6的非思考模式。至于和GPT-5.5对比,目前公开信息显示两者各有侧重,没有谁能做到绝对碾压。
价格更是直接杀疯了,V4-Pro每百万tokens输入只要1元,输出12元,V4-Flash更离谱,输入每百万tokens只要0.2元,输出只要2元。不少网友看完直接感慨,还是那个会玩普惠的DeepSeek,太接地气了。受限于目前高端算力的供给,Pro现在的服务吞吐还不算大,官方已经放出话,下半年昇腾950超节点批量上市后,Pro的价格还会大幅下调。
大伙可能没注意到,这次DeepSeek干了一件改变整个行业的事,它直接把V4全面迁移适配到华为昇腾芯片,底层代码从CUDA重写成了华为自研的CANN架构。这绝不是简单换个硬件跑模型,是实打实具有战略意义的选择,不少业内人都说,这次V4发布,就是中国AI的一场生死战。
之前黄仁勋在一档播客专访里明确说过,如果DeepSeek把新模型优化适配到华为芯片,对美国而言会是“一个可怕的结果”。这话从全球头号AI芯片供应商老板嘴里说出来,分量重到没法想象。当时不少人还摸不着头脑,不知道他为啥突然说这种重话,现在V4一发布,所有谜底都揭开了。
黄仁勋自己说得很直白,要是DeepSeek真的针对华为架构做好优化,会让英伟达处于劣势。很多人可能纳闷,不就是一个模型换个芯片适配,至于让英伟达老大这么着急上火吗。其实这事根本没表面看起来简单,它动的是英伟达攒了二十年的核心护城河。
英伟达真正的壁垒从来都不是GPU本身的算力,而是CUDA这个已经成了行业事实标准的软件生态。过去近二十年,几乎所有主流AI框架、开源模型,都把CUDA当成默认的第一优化目标。整个行业的开发者、工具链、培训教程全围着CUDA转,用得越久依赖越深,根本甩不开,就像早年PC行业离不开Windows一样。
要是中国的大模型一直离不开CUDA,等于把自己的命根子交到了别人手里。美国一收紧制裁,高端GPU不卖,英伟达一断供一涨价,整个行业直接就傻眼。DeepSeek要是跳不出这个圈子,发展得再快再好,命运始终捏在别人手里。现在这么一折腾,DeepSeek直接成了全球第一个不依赖英伟达的顶级前沿大模型。
DeepSeek本来就是业界出了名的会省算力,2025年初刚闯出名号的时候,就靠着极低的训练成本跑出了顶尖水准的模型,直接震动了全球AI圈。它那时候就证明了,堆算力不是做顶尖大模型的唯一路径,算法够厉害,工程师够聪明,一样能训出性能强悍的好模型。这次V4发布,再一次把这个思路验证得明明白白,华为昇腾也跟DeepSeek配合得相当到位,芯模协同之后,推理性能拉满,做到了高吞吐低时延。
现在DeepSeek这套极致压缩算力需求的技术,跟华为越来越成熟的本土芯片生态深度绑定,等于给整个中国AI产业链蹚出了一条全新的路。哪怕完全不依赖美国的硬件,我们也能实现自给自足的高速发展。这个势头现在已经起来了,V4发布直接带动了从芯片、服务器到云服务的全链条需求,目前中国AI周调用量已经达到美国的四倍多。
过去十几年,全球AI开发都被CUDA绑得死死的,DeepSeek这一下直接在这堵密不透风的墙上撞开了一个大口子。它不光证明了不用CUDA也能做出顶级大模型,还给整条赛道沉淀了熟练的工程师,跑出了可复制的优化经验,也给市场攒足了替代的信心。这才是黄仁勋说“可怕”的真实分量,只要这条路走通,美国靠芯片封锁建起来的护城河,比大家想象的要浅得多。
黄仁勋的这番话,其实也捅破了美国现在的战略困境。继续收紧出口管制,短期确实能延缓我们获取顶尖硬件,长期反而会加速我们本土替代生态的成熟。放松管制,又相当于直接给潜在竞争对手送核心工具,怎么选都别扭。但DeepSeek压根不纠结,已经打定主意要把这条路踏踏实实跑通。
这事对于国产芯片企业,还有所有被算力卡脖子的国内科技企业来说,有着里程碑式的意义。等国产芯片加国产AI生态彻底成熟落地,AI服务的整体成本能降低七成以上,不光给上下游的硬件、软件、开发者创造海量的机会,最关键的是,行业发展的主导权终于能攥在我们自己手里。DeepSeek官方最后说的那句话真的挺提气,不诱于誉,不恐于诽,率道而行,端然正己,会一直朝着实现AGI的目标走下去。
这种长期主义的劲儿,真的值得所有想要闯出新路的中国科技人学习,毕竟攀登科技巅峰,本来就是一场敢闯敢试的远征。
参考资料:澎湃新闻 DeepSeek V4适配华为昇腾,全球首个非CUDA顶级大模型诞生
热门跟贴