中美 AI 竞争的格局,正在发生一场静默却深刻的转变。风向,真的变了。

就在不久前,DeepSeek V2 万亿参数模型震撼发布,不仅性能直追国际顶尖水平,更实现了对国产芯片的深度适配。几乎同一时间,另一家国产 AI 巨头 Kimi 也推出了其 K2.6 模型。

两大模型,同样的万亿级参数,同样的开源路线,如同一记重拳,让硅谷感受到了前所未有的压力。但真正值得玩味的,并非仅仅是参数的堆叠或性能的接近。

打开网易新闻 查看精彩图片

如果你仔细翻阅这些国产模型的技术报告,会发现一个极具深意的细节:DeepSeek V2 在训练中,采用了此前由 Kimi 团队验证并改进过的优化器;而去年 Kimi 发布 K2 时,也明确表示其架构借鉴了 DeepSeek 的设计思想。

这看似寻常的技术交流,背后折射出的,是太平洋两岸截然不同的发展模式。

打开网易新闻 查看精彩图片

由于众所周知的原因,我们在高端算力芯片上被 “卡脖子”,能够获取的算力资源与美国巨头相比,存在巨大差距。单打独斗,各自为战,无异于以卵击石。

于是,中国的大模型玩家们,走上了一条完全不同的道路 ——开源生态下的抱团取暖与协同进化。你用我的架构降低研发门槛,我用你的优化器提升训练稳定性。

打开网易新闻 查看精彩图片

这种模式,本质上是将整个中国 AI 开源社区,拧成了一股绳,共同面对算力不足的挑战。

靠着这种 “神仙配合”,中国 AI 在算力被严重压制的客观环境下,硬生生用美国顶尖公司不到十分之一的资源,训练出了能够追平甚至在某些方面超越硅谷巨头的模型。这背后,是极致的效率追求。

反观大洋彼岸,美国的 AI 巨头们在做什么?OpenAI 和 Anthropic 等公司,陷入了激烈的 “内耗战”。

打开网易新闻 查看精彩图片

高管之间公开嘲讽,商业互踩,为了争夺有限的客户预算和更高的资本估值,竞争手段层出不穷。他们的核心逻辑,是商业垄断和利润最大化。

而中国开源阵营的核心逻辑,是生存战和效率战。目标极其明确:在资源有限的条件下,如何用最低的成本,做出最好的模型。

每一分钱、每一份宝贵的算力,都必须花在刀刃上,拼命压低从训练到推理的全链路成本。这种效率差距,最终都体现在了冰冷的账单上。

打开网易新闻 查看精彩图片

据公开数据估算,GPT-4 的训练成本可能高达数千万美元。而 DeepSeek V2 的训练成本,仅为五百多万美元。

另一家国产模型的训练成本,甚至更低。谁更务实,谁更会 “过日子”,一目了然。

这场竞争,远不止于模型本身。更深层次、更硬核的博弈,发生在芯片层面。

打开网易新闻 查看精彩图片

DeepSeek V2 的发布,一个里程碑式的意义在于,它深度适配了华为昇腾等国产 AI 芯片。顶级开源模型与头部国产芯片的 “强强联手”,正在尝试打破英伟达 CUDA 生态的长期垄断。

或许有人仍会质疑,国产模型在综合能力上,可能还暂时落后于最顶尖的硅谷模型。也有声音指出,像 DeepSeek、Kimi 这样的公司,其市场估值加起来,可能还不及对手的零头。

但我们必须清醒地认识到,当竞争进入这个阶段,底层模型的突破,早已超越了单纯的商业盈利范畴。它的核心价值,在于技术自主,在于 “不被卡脖子” 的能力。

打开网易新闻 查看精彩图片

这就像当年我们勒紧裤腰带也要搞出 “两弹一星”,不是为了主动攻击谁,而是为了当别人想封锁我们、打压我们的时候,我们手里有足够分量的 “重器”,腰杆能挺得笔直,有平等对话的资格。

今天,在 AI 这个决定未来国家竞争力的关键赛道上,国产大模型的崛起与开源生态的繁荣,正是我们手中正在锻造的 “重器”。它们或许还不够完美,但已经让我们看到了独立自主发展的清晰路径和无限可能。

这就是中国 AI 的底气,也是我们面对未来挑战时,最坚实的信心来源。