近日,我接受了 Capgemini 凯捷咨询研究院专访,围绕“AI 主权”的话题讨论了开源与闭源模型的竞争格局、AI 时代的数据与控制权问题,以及中国在开源生态、工程效率与 AI 硬件上的独特机会。
并不是每个国家都需要重造 OpenAI,但每个国家都需要拥有自主可控的 AI 能力。而基于开源模型构建本地化 AI 体系,或许正是大多数国家更现实的一条路径。
以下文章转载自 Capgemini 凯捷咨询研究院:
李开复博士是零一万物(01.AI)的创始人兼首席执行官,这是一家总部位于北京的人工智能公司,公司业务聚焦行业领先的产业大模型训练和企业解决方案,由创新工场人工智能工程院塔尖孵化。他曾是谷歌全球副总裁兼大中华区总裁,担任微软全球副总裁期间开创了微软亚洲研究院。李开复博士是《纽约时报》和《华尔街日报》畅销书《AI·未来》(AI Superpowers)的作者,该书探讨了中美两国在人工智能未来中的角色及其对社会的影响。李开复博士在美国接受了计算机科学的教育,并将其职业生涯奉献在了中美技术发展的交汇处。
01
交出AI控制权等于交出发展主动权
提问:几十年来,您一直在中美两国的技术、文化和地缘政治的交汇点上探索。 您如今如何定义人工智能主权,它为什么重要?
李开复:主权意味着很多层面。首先,它意味着对技术本身拥有控制权。 其次,它关系到数据安全。数据对任何企业而言都是核心资产,企业必须确保这些数据不会外泄。这样的担忧在全球范围内都很普遍,只是在美国相对没那么突出,因为美国市场对私有云的接受度更高。但在许多国家,企业普遍担心:自己的敏感数据会不会被用于训练另一国家开发的通用模型。
除此之外,还涉及“适配性”的问题。一个国家训练出来的模型,往往天然带有该国的价值观和意识形态,而这些未必适用于其他地区。只有掌握模型的控制权,企业才能根据自身需求进行微调,使模型真正符合组织的业务环境与文化语境。相反,如果模型部署在第三方云平台上,这种定制和调整能力就会受到很大限制。
提问:当北京、布鲁塞尔和华盛顿都在谈论人工智能主权时,他们谈论的是同一件事吗?
李开复:不完全是。不同的语境存在着不同的层次。
第一层是“适用性”。每个国家都希望拥有能够反映本国语言、文化和法律规范的模型。比如在一些伊斯兰国家,模型对于同性婚姻、酒精或宗教相关问题的回答方式,就需要与美国模型有明显不同。确保模型符合当地法律、宗教和文化,是一种合理且普遍存在的诉求。
第二层则是国家层面的竞争雄心。一些国家认为,只有建立自己的模型,才能在这场技术竞赛中占据一席之地。中国显然抱有这样的目标,日本、新加坡、沙特阿拉伯和印度也都公开表达过类似的野心。这种追求本身值得肯定。但有时,这样的目标也可能过于理想化。因为并不是每个国家都具备从零开始训练一个前沿通用模型的条件。美国拥有极其庞大的资源,中国同样如此,而大多数其他国家并不具备这样的资源基础。
不是每个国家都需要重造OpenAI,但每个国家都需要有自主可控的AI。更现实的替代方案是基于领先的开源模型继续训练,使其适配本国特定的语言、价值观和法规。这也是我认为除中美之外的大多数国家都应该采取的路径。
更现实的替代方案是基于领先的开源模型继续训练,使其适配本国特定的语言、价值观和法规。这也是我认为除中美之外的大多数国家都应该采取的路径。
我所说的“继续训练”不同于简单的微调。它更像是把开源模型当作一个“半成品”来继续加工。可以把它理解为:做一张披萨,不需要从种小麦开始。买来一张冷冻披萨,再根据自己的口味添加配料并重新烘烤。最终得到的,可以是“印度版披萨”,也可以是“日本风披萨”。经过“继续训练”的模型,就会成为更符合自身语境的产品。
更关键的是,这种方式的成本只相当于从零训练模型的百分之几:花费可能只是几百万美元,而不是数亿美元。开源模型最大的意义,是它让AI不再只是少数科技巨头的游戏。
02
美国靠封闭赚钱,中国靠开源追赶
提问:美国的出口管制究竟会对中国人工智能的发展产生什么影响?
李开复:这其实是一把双刃剑,目前还很难下定论。
GPU 出口限制只是双刃剑的其中一面。另一面则是,中国公司普遍非常务实。如果你去调研这些公司,会发现它们中的绝大多数并不试图击败 Anthropic 或 OpenAI。中国公司很清楚,自己不可能投入 500 亿美元去训练超大规模模型。中国公司能够获得的 GPU 资源本身就十分有限,其中一部分还是扩展性相对较弱的国产 GPU。在这样的条件下,他们真正思考的问题是:怎样才能把现有资源发挥到极致?
答案是极致的工程效率。DeepSeek(深度求索)就是最典型的例子。
当资源受到限制、但又有强烈动力去突破时,人们反而更容易在约束中实现创新。他们会优化模型架构,减少对 CUDA 的依赖,并将目标设定为“在现有条件下做到最好”,而不是一味追求绝对领先。
Necessity is the mother of innovation. 需求是创新之母。资源受限,有时是最好的创新催化剂。
中国公司在模型训练上的投入,往往不到美国顶尖公司的 10%,却依然能够做出能力达到对方 90% 到 95% 的模型,与美国同行之间的差距也只有六到九个月。
中国公司拥抱开源,还有一个更深层的结构性原因:他们无法在闭源市场中取胜,所以中国公司选择开放共享。
这更像是一种“学习小组”式的协作机制。并不是所有人坐在一起完成同一份作业,而是每个人都基于彼此公开发布的成果继续构建,由此推动整体能力不断提升。
相比之下,美国公司的模式更接近彼此独立的研究者。每个人都相信自己有机会赢得“诺贝尔奖”,因此会对核心技术严格保密。而中国公司的行为逻辑则更像是:既然依靠个人力量无法赢得“诺贝尔奖”,那么就通过汇集各方成果,从而在集体层面上更加接近目标。
更深层的战略问题在于:第一家实现通用人工智能的公司,是否会形成压倒性的统治地位?另一种可能性是,最终会有四家美国公司和两家中国公司,在彼此仅相差几个月的时间内先后达到这一水平,并各自服务于独立的生态系统。
如果回看历史的发展轨迹,会发现开源模型通常落后于闭源模型六到九个月,而中国模型落后于美国模型的时间差也大致如此。如果这种模式持续下去,那么这场竞争可能不会以“赢家通吃”的局面而告终。但这仍有待观察。
提问:哪些因素将最终决定主导模型?在人工智能或人工智能主权方面起步较晚,是否会使国家或公司处于绝对的劣势?
李开复:“AGI 一旦出现就会碾压所有竞争者”这种观点,虽然不能完全排除这种可能性,但我认为发生的概率很小。与其担心AGI碾压一切,不如看清生态才是真正的战场。即便未来是美国公司占据主导地位,我认为原因更可能在于它们建立起了强大的商业生态系统,而不是因为某次技术质变让所有对手一夜出局。
第一个类比是 Windows。
Windows 的成功,并不是因为其他公司做不出类似的操作系统,而是因为大量应用建立在 Windows 之上,企业也深度依赖这一体系。由此产生的收入,又持续为后续开发提供资金,进一步巩固 Windows 的领先地位。这种正向循环是切实存在且极具力量的。
从 Anthropic 的 Project Glasswing 等项目中,我们已经能够看到类似趋势。该项目只向美国顶级科技公司开放 Mythos 模型某些强大版本的独家访问权限。与此同时,Claude Code 也正在改变软件开发的方式,而企业愿意为这种能力支付巨额费用。收入会继续转化为更多算力投入,而更多算力又会支撑更强的模型。这个循环一旦形成,就会不断强化自身。
另外,在人工智能或“AI 主权”领域,起步晚并不必然意味着处于劣势。事实上,开源模型反而为后来者创造了重要的后发优势。
这里我想说的第二个类比是 iPhone 与 Android。
当人工智能真正进入全球大众市场时,这种分化会变得更加明显。美国模型的定价体系,本质上是面向高收入市场设计的。在封闭基础设施上运行高级 AI 工具,成本非常高。
相比之下,中国模型的成本可能只有前者的六分之一到十分之一。因此,当 AI 开始大规模进入中国、印度以及其他新兴市场时,美国的闭源模型很可能会因为价格过高,而被大量真实需求排除在外。
最终形成的格局,可能会非常类似于 iPhone 与 Android 的竞争。苹果获取了惊人的利润,甚至可能超过所有 Android 厂商利润的总和;但 Android 在全球用户规模和市场渗透率上,却明显占据优势。
AI 领域也可能出现类似局面:闭源赢利润,开源赢市场。闭源模型赢得利润率和生态控制力,而开源模型则赢得覆盖范围和普及程度。在这样的格局下,“起步晚”并不意味着失去机会。真正重要的,是根据自身资源、目标和市场定位,选择适合自己的路径。
提问:公司和国家是否应该担心少数几个平台会主导一切?
李开复:我并不认为最终会只剩下一种选择,这很大程度上是因为开源已经形成了不可逆的趋势。
从历史经验来看,未来更可能出现的格局是:一两个占据主导地位的闭源平台,与一个影响范围极广的开源生态系统长期并存。就像是 Linux 与 Windows、iPhone 与 Android。我认为,人工智能大概率也会沿着这一路径演化。
但需要注意的是,这种竞争关系会在不同层面呈现出不同形态。模型本身是一层竞争,围绕智能体构建的平台和生态,则是另一层竞争。
像 OpenClaw 这样的开放生态系统,正在逐渐成为智能体层的首选平台。它们正在从根本上改变 AI 获取和部署的成本结构。通过结合开源模型,OpenClaw 让企业和开发者能够构建起强大的 AI 工作流,而不必被绑定在某一家专有技术栈之上。
这一点尤其重要。因为对于很多国家、企业和开发者而言,闭源平台过于昂贵,并不具备大规模普及的条件。
因此,我认为最终更可能出现的,并不是彻底垄断的局面,而是一种长期共存的结构:一边是拥有强大商业模式的闭源生态系统,另一边则是覆盖范围更广、全球影响力更强的开源生态系统。
开源生态的利润率或许更低,但它应用门槛更低,也因此天然更容易普及。只有当市场只剩下单一选择时,高度垄断才会真正变得危险。而像 OpenClaw 这样的开放生态系统,恰恰能够避免这种局面的出现。
03
AI下半场的机遇,藏在中国硬件里
提问:您曾提出中国在物理AI、设备和制造方面具有结构性优势。这种优势能够持续多久?
李开复:硬件和软件,本质上是两种完全不同的竞争。iPhone 刚发布时,美国公司几乎掌握了全部优势:产品设计、软件工程能力以及全球市场渠道。当时,中国主要承担的是制造角色。富士康当然也赚到了钱,但可能只有苹果的零头。
但今天,情况已经发生了变化。
如今,中国已经建立起几乎能够制造任何硬件产品的完整供应链和产业生态。从手机、PC,到机器人、工业设备,再到智能眼镜、手表和可穿戴录音设备等新型硬件,中国都具备成熟的制造能力,制造成本也明显低于美国。
华为、小米和字节跳动都已经开始大规模布局硬件。过去支撑美国硬件霸主地位的那些壁垒,如今已经不复存在了。AI 时代的“iPhone”很可能是由中国设计、中国制造、中国品牌。
还有一个趋势值得关注。我们正在进入一个由语音驱动 AI 的时代。语音识别技术本身正在接近“几乎完美”的状态,同时大语言模型最重要的能力之一,就是让人与机器能够通过自然语言直接交互。未来,大量记录环境互动、工作交流和会议内容的设备,会持续生成一种全新的数据类型。
举个例子,我每天都在使用字节跳动的录音设备。公司里的每一场会议,都会被大模型捕捉、转录,并进一步用于分析。我不可能亲自参加每一场会议,但借助 AI 分析,我实际上可以“虚拟地参与”所有会议。这会成为一种影响深远的运营洞察工具。
如果把视角再拉远一点,中国在大规模数据生成方面,其实也具备一定的文化优势。
在 AI 1.0 时代,中国凭借庞大的人口规模和互联网使用量,拥有明显的数据优势。在由大型语言模型主导的 AI 2.0 时代,这种优势一度发生转移,因为模型训练所依赖的数据主要来自公共互联网,而英语互联网的数据质量明显更高。
但现在,随着音频、视频以及现实世界互动数据的大量涌现,中国的优势正在重新回归。这种优势一部分来自规模本身,另一部分则来自文化环境。相比欧洲和美国,中国社会对于录音和数据采集的文化抵触相对更弱。
除此之外,中国政府的政策方向,也非常明确地聚焦于推动“人工智能+”赋能实体经济。
中国经济本质上仍然是一个制造业主导的经济体。因此,国务院公开提出的重点方向之一,就是打造智能经济新形态,推动重点行业领域人工智能商业化规模化应用。这种政策导向,进一步带来了其他国家尚未形成的需求规模、产业关注度以及资金协同。
与此同时,中国的风险投资机构也更愿意投资硬件创业公司。因为他们普遍相信,中国在硬件领域具备天然优势。中国制造硬件的成本更低、资金需求更少、产品迭代速度也更快。
04
大多数国家,不必从零重造OpenAI
提问:在“AI 主权”这件事上,您认为各国最容易犯的错误是什么?
李开复:最常见的误区,是把问题简单理解为只有两种选择:要么接受美国模型,要么从零开始训练自己的模型。但现实并不是非此即彼。
真正存在的,其实是三种路径。AI主权不是二选一。开源,就是那条最应被重视的第三条路。
第一种,是直接采用美国领先的闭源平台,同时清楚认识到其中涉及的主权限制,接受在数据、控制权和自主性上的部分让渡。
第二种,是从零开始构建模型,并试图与美国和中国竞争。但如果选择这条路,就必须认识到一个现实:对于大多数国家而言,这条路径成功的可能性并不高。
真正现实的道路,不是重造OpenAI,而是基于开源建立自己的AI体系。这也就是第三种路径,采用开源模型,再基于自身的语言、价值观和监管要求继续训练。这条路径成本更低,而且更具现实可行性。
关于凯捷集团
凯捷 (Capgemini)是一家由AI驱动的全球业务与技术转型合作伙伴,旨在创造切实的商业价值。凯捷是一个负责任的多元化组织,集团成立于1967年,总部位于法国巴黎,在50多个国家拥有超过42万名团队成员。凯捷凭借深厚的行业专业知识和强大的合作伙伴生态系统,提供端到端的服务和解决方案,充分发挥战略、技术、设计、工程及业务运营等方面的能力。集团2025年全球收入达到225亿欧元。
原文出自 Capgemini Research Institute 官网
https://www.capgemini.com/insights/research-library/a-conversation-with-kai-fu-lee/
热门跟贴