我看到这两天美媒那套操作,说实话,有点好笑,又有点后背发凉那种感觉。标题啥意思呢?中国成长太快了,DeepSeek又“偷了连美国也没有的技术”。我当时心里就一句话:这剧本怎么又重拍一遍,只是主角从华为换成了DeepSeek而已。
行,咱一点点拆开聊,别光上头,还是得看参数、看格局。
我先说结论啊,美国这波是真急了,而且是从总统办公室急到华尔街那种。
前阵子路透社、华尔街日报一通爆料,说OpenAI的高管给美国政府写密信,内容差不多是两层意思:
“美国AI领先优势没多大了,中国追得太快了”
“DeepSeek在用模型蒸馏,从GPT-4这些模型里学东西,是偷窃”
你品,这逻辑是不是似曾相识。2018年前后,华为5G刚冲出来,美国连自己的5G网络都没铺好,就有人跳出来喊:华为偷了美国“还没有的技术”。这话放在当时就是个国际笑话,没想到几年过去,连说辞都懒得改一下,就把“华为”三个字换成“DeepSeek”。
问题来了,他们到底在怕啥?
咱先把玄学情绪往旁边放一放,看点干货数字。
有几组数据你要有个概念:
成本差距有多夸张
公开资料里提到,DeepSeek训练高性能模型,用的预算大概就是几百万美元级别,业内流传一个比较典型的数是在六百万美元这个档位,对标的是什么呢?同级别能力的GPT系模型,训练成本经常是几千万甚至接近上亿美元。也就是说,人家花你一个零头的钱,干出了一个能掰手腕的模型。
推理成本这块,更扎心。有机构测算过,同等任务下,DeepSeek类模型的调用成本能做到某些美系模型的几十份之一,这就不是便宜一点点,而是把商业逻辑直接打穿。以前美国那帮巨头讲故事都是那一套:AI是顶级奢侈品,只有砸天价算力、上万美金一块的卡,别人才能进局。结果中国这边直接给你演了个“穷人也能玩得起”的版本。
技术差距在缩多少
高盛的研报里有个很刺眼的结论:中国顶级大模型和美国顶级模型的差距,只剩下3到6个月。两年前,大多数人还在说差几年,现在直接压到一个产品迭代周期里边去了。这种体感是什么?就是美国刚把新旗舰发布会开完,中国这边工程师已经在内测“同档级原型机”了。
算力背后的底牌不是芯片,而是电
马斯克自己在播客上说过一句挺吓人的话,大概意思是:2026年中国发电量可能是美国的3倍。你别看这像一句电力新闻,对AI行当来说,这等于是说:AI时代真正的“货币”不只是高端芯片,还是电力产能。芯片你可以禁,电你很难全球封。
再往下对上路透社的那条线:中国被掐7纳米以下的脖子之后,国内厂商拿着老一代深紫外光刻机硬是升级改造,甚至有媒体放风说EUV原型机已经整出来了。你说性能肯定比不上ASML成熟产品,但问题在于:这条路不是死路,而是被逼出来的另一条技术分叉线。
所以你看,DeepSeek这事,压根不是一个公司和一个公司的撕扯,而是把美式AI的底裤给扯了一角:原来你们天天拿来当护城河的东西,其实没那么神圣。
再回到美国这次最核心的指控:模型蒸馏,是不是偷?
我用特别通俗的话说一下蒸馏是干嘛的。
你可以把GPT-4想象成一个特别牛的老师,DeepSeek这种小模型就是一个家境一般的学生。这个学生没钱买全套昂贵教材、没有最顶配的教室,就干了一件事:天天看老师怎么解题、怎么看世界,用这些“示范过程”来学思维方式,而不是偷试卷答案。
它学的是什么?是“你遇到这类问题,会优先考虑哪几种思路”。这才叫蒸馏。
那美国这边怎么说呢?他们现在的说法有点像是:你看了老师公开的直播课、记了笔记,最后考试考得不错,于是老师跳出来说:“你偷了我的知识产权”。
问题在这儿,你当初把课挂在互联网上、开放接口给全世界开发者调用,目的是啥?OpenAI当年自己说得很好听,是“为了人类进步”“推动AI普及”。轮到中国开发者合法合规用公开接口去调教自家模型时,话风直接改口成了“卑劣偷窃”。同一件事,轮到你叫创新,轮到别人就变成犯罪,这种双标嘴脸才是真让人想笑。
更尴尬的是,普林斯顿大学信息技术政策中心那边直接发文点名,说现在的法律体系根本不是为AI蒸馏设计的,勉强把蒸馏按“盗窃”去扣帽子,法律依据非常薄弱。这已经不是立场问题,而是专业人士都觉得OpenAI这锅甩得太硬。
还有一点很多人容易忽略。美国这些大模型,训练语料里有大量中文互联网内容,这些内容里既有我们的技术论文,也有开发者博客、社区讨论、知乎帖子,照他们现在的逻辑,这算不算对中国知识的“蒸馏”?要真按“互相学习等于偷”这标准,全球互联网直接别玩了。
你可能会问,那DeepSeek这么干,是不是代表中国真就已经“超车”了?
我反倒更冷静一点。硬件这块,差距还在。比如有媒体引用日系机构数据,说英伟达最新一代AI芯片在某些指标上性能是华为同档产品的好几倍,甚至预期未来几年还会把这个差距拉大。基础研究占研发经费的比例,中国也就六个点多,美国那边十六点多,这是打地基厚度的问题,短期很难一下子抹平。
可你别忘了,技术竞争有时候赢的不是“谁配置拉满”,而是谁能“在被限制的条件下,把每一份资源榨干”。DeepSeek这波厉害的地方,就在于:它用的不是最烧钱最豪华的路线,而是架构、算法、调度全方位往“效率极限”打,把别人眼里“淘汰卡”“便宜电”玩出了新东西。
这个思路,跟华为当年被掐脖子之后上“芯片叠加”“架构重构”有点像。美国一旦开始搞封锁,中国工程师的默认反应就变成了:“行,你不让我走这条大路,那我就去山里绕一条小路出来”。每绕出一条,护城河就塌一块。
再说一个很现实的点:资本市场其实比政客诚实得多。
MiniMax在港股上市首日暴涨,智谱AI跟着火了一把,这是啥信号?就是钱在用脚投票,认的是“中国AI这条线已经不再是‘陪跑玩家’”,而是开始走一条不一样的路线了。香港那边公开发售几百倍认购,人家散户、机构都是拿真金白银砸出来的态度。
你再对比一下美股那边,英伟达因为中国低成本AI冲击,某几天股价单日跌十几个点,这不是情绪,而是“原有商业模式被重定价”。当投资人发现:原来说好的“只有我这种超高成本玩家才配玩AI”,现在变成“别人拿一部分成本也能玩,而且效果不差太多”,那整个估值体系都得重新算账。
这时候,美国那边很多动作就好理解了:一边用“国家安全”的帽子给中国厂商定性,一边在话术上把技术争论抬高到“文明价值观之争”“盗窃与被盗”的戏剧冲突。说白了,就是不敢承认一个事实:中国工程师用更低成本,把他们当成护城河的那套算力神话给砸出了口子。
回到我个人一个很直观的感受。
从华为5G,到TikTok,再到今天的DeepSeek,你会发现一个很有意思的规律:只要有中国公司在某条赛道上第一次真正动摇美国的垄断叙事,它就会自动被打成“安全威胁”。
通讯领域有华为,内容平台有TikTok,AI方向现在有DeepSeek,后面还可能冒出一堆名字你现在都没听过的小公司。这不是单点事件,这是中美科技博弈棋盘上的连续落子。
中国这边的路数,其实已经越来越清晰了:高端芯片暂时被卡,就在成熟制程把国产设备、国产材料一步步推上来;算力不够,就从算法、蒸馏、系统优化去抠效率;基础设施上,从电力、清洁能源、数据中心入手,把底层“供血系统”搭好。你要说差距,还在;你要说趋势,确实已经压到对面神经上去了。
写到这儿,我自己心里的态度挺简单的:
一方面,我很反感美国这套“自己当年疯狂爬网叫人类进步,轮到别人合法学习就变成偷窃”的双标话术,这真的挺掉价的。另一方面,我也不太希望国内被吹成“我们已经全面碾压美国”,这话听着爽,但对产业发展一点好处都没有。技术这个事,本质上就是一场马拉松,你今天领先半圈,明天人家更新一代架构又追回来,很正常。
真正让我觉得有意思的,是中国这代做AI的年轻工程师、创业者,已经习惯在高压、封锁、资源有限的条件下去找解法,这种“约束环境里进化出来的适应力”,才是未来五到十年最值钱的东西。
那聊到这里,问题留给你:
你更在意的是什么?是DeepSeek这类低成本高智能路线,会不会真的改变AI行业的游戏规则,拉低门槛?还是你更担心在芯片、基础研究这些硬核底层上,中美差距短期内还是不小?要你现在掏钱投,只能在“美式烧钱大模型”和“中国式抠效率路线”里二选一,你会站哪一边?欢迎在评论区聊聊,我挺想看看大家真实的选择的。
热门跟贴