打开网易新闻 查看精彩图片

算力神话正在松动

在科技圈,硅谷一直有一种“造物主”般的傲慢。从大模型诞生那天起,OpenAI的 CEO奥特曼就给全世界洗脑了一套暴力美学:智能等于算力,算力等于显卡,显卡等于成功。

但这套逻辑,正在被一群中国“算法疯子”拆解。

近日, Google的一项研究发现,DeepSeek的R1和阿里云的qwq-32B模型,竟然能够模仿人类的集体智能。

简单说,在处理难题时,不再是一个人在战斗,而是在内部演化出了一个“思想社会”。其中不同人格特征和领域专业知识的相互作用产生了更强大的能力。

大模型行业从不缺“堆料者”,但能让 Google 弯下腰来研究底层逻辑的,寥寥无几。这不仅是技术的胜利,更是中国企业在算力围堵下,硬生生走出的一条“暴力效率主义”血路。

Deepseek更懂“省钱”

长期以来,硅谷的大模型发展路径高度趋同甚至单一:堆最贵的卡,组最多的集群,投入最激进的资本。

从 GPT-3 到 GPT-4,再到 GPT-4o,这条路线被一次次验证有效。Meta 为了 Llama 3 囤积了数十万张 GPU,微软与 OpenAI 推进的“星际门”项目,投资规模动辄以千亿美元计,覆盖算力、数据中心、电力基础设施等全链条。这种打法并不复杂,本质上是通过资源冗余换取确定性领先。

换句话说,当算力足够便宜、资本足够充裕时,工程效率往往并非首要约束,真正重要的是“规模先到位”。

但 Google 这份研究揭开了另一个真相:DeepSeek 们之所以强,不是因为它们比 OpenAI 更能烧钱,而是它们更懂“省钱”。

研究指出,DeepSeek 等中国模型的能力跃迁,并非来自算力规模的指数级扩张,而是来自推理阶段内部结构的重构。

这些模型在面对复杂指令时,并不是沿着单一生成路径一路向前,而是会在内部并行展开多种解题策略,并通过持续的内部比较、博弈与修正,逐步收敛到更稳定的答案。

这种近似“多代理协商”的模式,并不追求单次推理速度的极限,却显著降低了单位算力下的错误率与返工成本。在算力受限的环境中,这种“少走弯路”的能力,往往比“跑得更快”更重要。

正是在这一背景下,MoE与 GRPO等技术路径开始在国内模型中被高度重视。MoE 通过将模型能力拆分给不同“专家模块”,避免了每一次推理都全模型启动;GRPO 则通过分组对比和相对优化,提升模型在推理阶段的稳定性和可控性。

这类技术选择的共同目标只有一个:把有限算力的“智能产出”榨到极致。

这并不是一次偶然的技术选择,而是一种被现实约束反复塑造出的工程哲学。

如果说硅谷仍在押注“重装推进”的工业化路线,那么中国模型更像是在修炼一套轻量而高效的技术体系。通过结构、策略和调度上的精细设计,对冲算力劣势。

这种“算法效率主义”并非理想主义,而是一种典型的生存型进化。当资源不再无限供给,效率本身就会从加分项,转变为最核心、也最难复制的竞争壁垒。

大厂护城河的坍塌

在 Google 的研究案例中,被反复引用的中国模型,并不是声量最大、发布会最密集的玩家,而是 DeepSeek和阿里通义千问。这并非简单的“技术偶然”,而是中国 AI 竞争的“分水岭”已经出现了。

过去两年,国内大厂们沉迷于参数对标、榜单排名和在发布会上“吊打 GPT-4”,忙着在朋友圈晒各种看不懂的榜单,这些能在短期内赢得更多注意力。

但从基础研究和工程演化的角度看,这种竞争方式的边际价值正在快速下降。真正进入全球研究视野的,反而是那些持续在模型架构、推理效率和成本结构上做“脏活累活”的团队。

DeepSeek 背靠幻方量化,其技术团队长期浸泡在金融工程语境中,对算力成本、延迟控制和稳定性有着近乎苛刻的要求。在量化交易领域,算力从来不是无限变量,“如何用更少计算得到更可靠结论”本身就是核心能力。

因此,DeepSeek 从一开始就没有将重心放在应用层叙事上,而是持续死磕推理成本与模型结构。即便没有万卡集群,只要架构足够聪明,依然可以逼近前沿能力。

打开网易新闻 查看精彩图片

而阿里通义千问所选择的路径,则更具平台型特征。

通过持续开源模型底座,阿里将模型训练、评测和场景验证的一部分成本,转化为全球开发者的协同实验。这种做法短期内看似削弱了“独占优势”,但从长期看,却显著加快了模型在真实复杂场景中的演化速度。

在这种开放体系中,模型更容易暴露问题,也更快完成修正,从而在模拟“集体智慧”与复杂决策方面走得更远。

反观某些还沉溺于做“套壳应用”或只顾着买流量的大厂,护城河正在变得摇摇欲坠。应用层的繁荣,建立在底层能力外包的基础之上,一旦底层模型的差距被拉开,应用层的优势往往难以长期维持。

互联网行业从不缺跨界者,但真正成功的寥寥无几。因为底层逻辑一旦错位,再多的产品包装也只是阶段性繁荣。

在 AI 领域,如果不能在算法或架构层贡献新的认知与方法论,那么竞争最终只会被压缩到应用层的价格战与内卷之中,而这,恰恰是最容易被后来者颠覆的地带。

智能的“社会化”

Google 的这项研究,最细思极恐的地方在于:如果 AI 内部已经能模拟“集体智慧”,那么人类精英的价值还剩下多少?

研究提到,DeepSeek R1 等模型展现出的“内部辩论”能力,本质上,这意味着人类组织中大量依赖流程协作的岗位,将不可避免地被重新定义。

过去,一个大型企业的重大决策,往往需要多个部门参与:市场调研、战略分析、风险评估、财务测算……

而现在,一个具备强推理能力的 AI Agent,已经可以在内部完成成百上千次模拟。

这并不是“自动化”,而是决策机制的内化。

对于字节跳动、美团、百度这类高度依赖数据与算法的公司而言,这意味着从“人机协作”向“机机协作”的过渡。

对于制造业巨头,如小米、比亚迪而言,这意味着供应链与生产系统将第一次拥有“自反能力”。

它们不只是执行命令,而是能够对命令本身提出质疑。

这也是为什么,越来越多企业开始将强推理模型引入非前端场景。不是为了聊天,而是为了判断。

回到最初的问题:算力不够,智慧真的能来凑吗?

DeepSeek 与 千问给出的答案是:当资源不再无限,智慧才会被迫进化。

历史反复证明,真正改变世界的技术路径,往往诞生于约束之中,而不是温室里。

今天,中国 AI 正在用一种并不张扬、却高度有效的方式,重写大模型的竞争逻辑。

它未必最快,但可能更稳;未必最贵,但更可持续。

而这,或许正是下一阶段智能竞争的关键分水岭。

马斯克曾多次强调:“未来所有的工作都将由 AI 完成,除非你想为了兴趣而工作。”当中国 AI 提前摸到了“集体智慧”的门槛,这种预测正加速从科幻变为现实。