这件事的消息源不是什么小道消息。爆出这个数据的,是管理着超过百亿美元基础设施基金的美国顶级风投机构a16z。
他们的合伙人在审查一份份投资提案时,发现了一个让自己都觉得有点意外的规律——来找他们融资的美国初创公司,技术栈里越来越多地出现了中国AI模型的名字。他说,那些用开源模型的初创公司,八成在用中国的。
这个"八成",没你想的那么简单
先把这个数字讲清楚,因为它在网上流传的时候,已经被传歪了一圈。
这位a16z合伙人叫Martin Casado,有着扎实的技术背景,他后来在社交媒体上专门出来解释:那个80%,指的是"在使用开源模型的初创公司里",不是全体。而使用开源模型的公司,本身也只占向a16z提案总数的两到三成。
换句话说,如果你把分母换回全部申请者,真实比例大概是16%到24%。
这当然比80%小多了。但Casado也说了一句话值得记住:这仍然是个显著的趋势。毕竟,他说的不是某个冷门小众的开源社区里发生的事,而是全球顶尖风投机构在做尽职调查时,从一份份商业计划书里统计出来的现实。
他们看到的那些名字,主要是两个:Qwen,也就是阿里巴巴的通义千问;还有DeepSeek,幻方量化旗下那家几乎没融过外部资金的AI公司。还有月之暗面的Kimi。
这些公司的产品放在GitHub或者HuggingFace上,任何人都可以下载、部署、修改,不用付钱,也不用向任何人汇报你拿它做了什么。
这个数据后来被引进了美国国会的听证会,成为讨论AI出口管制政策效果时的参考材料。你可以不同意这个数字的解读方式,但它被摆上了华盛顿的桌面,这件事本身就说明问题已经不小了。
为什么用?因为便宜得不讲道理
如果你问一个美国初创公司的创始人,为什么选中国的开源模型,答案几乎不会是什么政治立场,也不会是技术信仰,就是一个字:省钱。
我们来看一个具体的对比,不用太精确,感受一下量级就够了。用主流美国商业模型的API处理同样规模的文本,成本可能是中国开源模型的几十倍甚至上百倍。有家做翻译的初创公司,换到中国开源模型之后,月度运营成本直接砍掉了将近九成。
对一个还在烧早期投资人的钱、还没找到盈利模式的团队来说,这不是锦上添花,这是续命。
说到这里必须讲一个例子,因为这个例子太典型了。Airbnb——不是什么小公司——它的CEO Brian Chesky在接受采访时承认,公司的AI客服系统大量依赖阿里巴巴的Qwen模型。
他说这个模型又快又好又便宜。与此同时,他对OpenAI提供的集成工具给出了一个相当保守的评价——大意是说,还没到可以放心用的程度。
这里有一个细节值得玩味:Chesky和OpenAI的CEO Sam Altman关系很好,是朋友。一个人在有更便宜选项的时候选择了便宜的,这本来不奇怪;奇怪的是,他选择的这个"便宜的",恰好来自大洋彼岸,而他本可以支持老朋友的生意。
再往上看一层。DeepSeek训练它的旗舰模型,花了大概五六百万美元。而业内估计训练GPT-4的成本,在一亿美元量级,甚至更高。
同一个档次的性能,成本差了十几倍到几十倍。这不是因为中国工程师更聪明或更勤奋,而是因为他们发明了一套在有限计算资源下榨干每一点效率的架构方法。
这种成本结构上的差距,反映在开发者社区里就变成了一组数字:Qwen全球下载量已经突破七亿次,基于它衍生出来的模型超过了十七万个,已经超过Meta的Llama,成为全球规模最大的开源模型家族。
那道用来拦截中国AI的墙,可能修反了
现在来讲一件有点讽刺意味的事。
美国政府这几年一直在管控对华高端芯片的出口,目的是限制中国训练更强大AI模型的能力。从英伟达最顶级的GPU到各种特供版,一轮一轮地加码。逻辑很直接:你没有最好的计算资源,你就跑不了最大的模型。
结果发生了什么?DeepSeek就是用一批受限制版本的芯片,通过重新设计模型结构,用五六百万美元的成本,训练出了一个性能对标GPT-4级别的模型。卡脖子反而卡出了一种极致的工程效率。
然后这个结果被开源了,全球的开发者都可以拿来用。出口管制管的是硬件,它管不了一段可以自由传播的代码。
这件事最终逼出了一个更戏剧性的回应——OpenAI在沉寂了六年之后,重新开始开源自己的模型。而它的CEO说的那句话相当于自己把这件事讲清楚了:如果我们不开放,世界可能会主要建立在中国的开源模型上。
这句话有两层意思。第一层很明显——他承认了压力。第二层更值得琢磨——他说的是"可能会",而不是"可能开始"。言下之意,这件事已经在发生了。
今天在热门的AI编程工具里,开发者最爱用的前二十个模型里,有七个是中国的。在一个专门评测AI设计能力的平台上,由用户投票选出的前十八名全部是中国模型,第一个美国模型排在第十九位。
这不是一个还在酝酿的威胁,也不是一个需要预防的风险。它是一个已经发生在代码编辑器里、创业公司的服务器上、融资申请表的技术栈一栏里的现实。
一家管着百亿美元的风投机构,坐下来翻提案的时候,发现大多数人已经做出了同样的选择。这件事最不需要解读的地方,恰恰是那个数字本身——而是那个数字背后,一个理性的市场在没有人协调、没有人号召的情况下,自发走向了同一个方向。
热门跟贴