IPP评论是国家高端智库华南理工大学公共政策研究院(IPP)官方微信平台。
导语:
长期以来,美国凭借技术先发优势以及庞大的算力、数据资源,在AI领域占据垄断地位。在此背景下,中国人工智能初创公司DeepSeek绕开美国主导的AI"算力竞赛",通过开源协作与架构创新,以极低的训练成本,打造了比肩美国顶尖产品性能的大模型。DeepSeek的成功突围,也唤起了针对后发国家在人工智能等前沿技术领域“复制-追赶-复制”发展路径的再思考。
IPP研究员蒋余浩指出,DeepSeek的突围,增强了以非线性创新观为指导、激励多技术路线探索的政策的现实可行性,这种政策可以成为发展嵌入不同行业的人工智能的保障。同时,DeepSeek的发展路径预示了不同于当前美国少数科技巨头主导科技和产业的图景,将为诸多后发国家和企业展现更丰富的发展经验。
*本文发表于《电子政务》2025年第3期,为国家社会科学基金项目“数字时代推进包容性增长的国家赋能理论及治理创新研究”成果之一。
中国人工智能企业深度求索(DeepSeek)在2025年新春前后相继发布开源权重模型DeepSeek-V3和DeepSeek-R1,以相对较小的训练成本、参数规模,实现了堪比GPT-4o、Claude 3.5 Sonnet、OpenAI o1等大模型的性能,在短时间内震惊全球。
据统计,到2025年2月中旬,DeepSeek-R1的活跃用户已达2000万。关于DeepSeek-R1的技术层面问题,海内外专业人士已有许多评论。然而,DeepSeek发展经验所展现的对于科技和产业政策领域的启发,却有待深入探讨。本文拟以DeepSeek面对的争议为切入,揭示DeepSeek-R1等新产品显露的人工智能多技术路线探索的特征,进而分析科技和产业创新政策的着力方向。
一、后发优势的DeepSeek抑或更复杂的发展图景?
红线
有一种强烈的讨论声音:DeepSeek-R1是否仅仅只具备了后发优势?后发优势通常是指:后发国家或地区在经济发展过程中相对于先进国家或地区所具有的各种有利条件。
亚历山大·格申克龙(Alexander Gerschenkron)的经典著述阐明,后发国家可以通过选择在一定领域内集中资源,引进先进国家的资金、技术和设备,节省科研探索的费用和时间,并快速培养本国人才,在较高起点上推动工业化进程。 [1]仅从后发优势的理论视角来看,DeepSeek对美国科技巨头大模型技术的借助,使其产品并没有超越此前在许多科技和产业领域进行“赶超”的经验。
然而,DeepSeek实践还揭示了更复杂的图景,是后发优势理论难以涵盖的。
亚历山大·格申克龙(Alexander Gerschenkron)在《经济落后的历史透视》一书中指出,工业化并不存在一种统一的模式,而是随着各国起点不同,其工业化道路、策略与模式会出现显著差异。
(一)赶超战略下容纳多种具体策略,形成复杂的科技和产业发展景象
自二战结束以来,美国成长为科技能力最强的国家,伴随着经济全球化时代的到来,美国科技精英和商业精英将其科技创新网络和工业生产体系向全球延展,充分利用世界各国的优秀人才、优质且廉价的劳动力以及当地的环境资源、原材料等。这一系列深远的变化铸造了美国科技在全球的影响力和统治力。
同时,得益于全球科技创新网络和工业生产体系的构建,许多原本产业基础薄弱、科技水平不高的国家和地区,也获得了重要的发展机遇。如以色列、爱尔兰、亚洲四小龙和中国大陆等,借助模仿创新(from imitative to innovation)、弯道超车(from short-cycle to long-cycle technologies)或者换道赛车(leapfrogging)等多项具体策略,不但建立了科技和工业发展体系,甚至发展出了本土的大型高新科技企业,成为该产业全球价值链上不可被忽视的竞争力量,并因此冲击了旧有的国际科技创新网络和工业生产体系。 [2]
DeepSeek-R1的出现,打破英伟达等科技巨头“堆积算力”的路径,在短期内造成美国科技巨头股价暴跌,这个市场反应说明了DeepSeek不只是处于后发跟随者的角色,更具有求索新策略的意义,其发展路径至少可以预示不同于当前美国少数科技巨头主导的科技和产业的图景,为后发国家和企业展现了更丰富的发展经验。
(二)后发优势理论无法为如何避免“追赶者陷阱”提供有效指引
由基于后发优势理论而形成的工业化发展策略,经常导致后发国家即使取得了一定程度上的“追赶”效果,却难以摆脱被锁定在先进国家的既定技术路线内的命运。我国在很多重要企业中曾经出现的“引进-落后-再引进”的“追赶者陷阱” [3],是几乎所有后发国家走上工业化道路都会遇到的困境。就人工智能而言,自2022年11月OpenAI发布ChatGPT以来,大语言模型(LLM)成为主流技术路线,获得了世界各国从业者的追捧。
根据不完全统计,中国在2023年下半年进入“百模大战”状态,到2024年9月,中国企业共发布了238个大语言模型,多数是延继美国科技巨头的路线,但性能上无法与各类有影响的大模型相比,被业内专家批评造成了巨大的资源浪费。DeepSeek没有沿着这条拼算力的路径前进,其实践探索无论后续将面对多大的争议和困难,都可以说是启发了关于在人工智能领域如何实施追赶策略的反思,表明人工智能还远未到定型阶段,可以进行多技术路线平行探索。
实际上,在DeepSeek-R1推出后不久,斯坦福大学李飞飞团队和华盛顿大学研究人员成功打造s1-32B的人工智能推理模型,以不到50美元的费用,使用了16块英伟达H100 GPU,耗时26分钟就完成了训练。这些人工智能新产品的出现,充分证明在“堆算力”的路径之外,还可以尝试其他的探索方向,避免“追赶者陷阱”。
二、认识DeepSeek探索路径的理论视角:非线性创新观
红线
怎样从理论上认识以DeepSeek为典型代表的创新探索路径及其展露的更为丰富、复杂的发展图景?
在科技研究中,后发国家容易陷入以“线性创新观”来指导制定公共政策的陷阱,也即将创新视为沿着“基础研究→应用研究→产业转化”线性路径发展。在后发优势理论和追赶策略的支撑下,这样的政策有相当的益处:
一是便于国家集中一定的资源从事重大科技攻关,引导产业发展;
二是便于国家对整体的产业结构进行不断调整,适应国际竞争的要求;
三是便于国家围绕相应的科技和产业内容制定如外资、外贸、技术引进等配套性政策。
然而,一旦认识到科技和产业的发展将会有更丰富、复杂的前景,则这种线性创新观就不足以成为公共政策的指导理念。
信息通信技术革命兴起之后,相关领域的科技和产业的创新发展已经清晰展现出非线性发展的路径。哈佛大学科技政策专家指出,近几十年里奠定了信息通信时代基础的诸项科技成果,都具有不易被简单归类为基础研究或应用研究的特性,而是在科学发现与技术发明之间存在“互动循环”的复杂关系。
比如,双极型晶体管的发明带来了晶体管效应的发现,这些发明和发现集合在一起又创造了应用在电脑、汽车等产品上的各类处理器和芯片; 集成电路的发明带来通用计算机的发明,又促进了计算机科学的发展; 结合材料工程的光纤以及异质结构的发明,使全球通信网络在物理基础设施和传输速度上成为可能; 旨在提高异质结导电性的材料研发工程,还意外带来了二维系统中分数量子化现象(fractional quantization)以及一种新形态的量子流体的科学发现。 [4]
与之前的信息通信技术一样,当前的人工智能也是多学科知识、多技术发明集合的产物,既有各个学科基础原理方面的突破,也有在处理技术问题过程中解决一系列挑战的成果。
例如,大模型利用了多种技术对模型进行优化和调整,如自监督学习和增量训练等。这种为处理技术挑战而形成的专业知识及技术工具的集成和突破,表明大模型既是一项可供应用的科技产品,又是在多学科融合基础上的一次突变,因此尤其需要确立“非线性创新观”加以理解。
人工智能的非线性科技创新特征决定:
其一,可以基于研究端对国际前沿的追踪或者研究领域本身的创新推动人工智能发展;
其二,也可以基于应用端对研究端提出要求,形成新的研究方向,生产更丰富的人工智能产品。
DeepSeek的探索成就,尤其在后一个方面开放出了更多的可能性——实现了对于产品的广泛应用,为再进一步基于多样应用需求而开发更多的科研和技术产品创造条件。
DeepSeek的这个潜能,蕴藏值得讨论的理论意义。
杰弗里·丁(Jeffery Ding)的新近研究指出,与国际关系经典文献中总结的“先进部门引发全球权力结构变化”的观点不同,实证证据表明,“推动先进技术扩散的制度”对于大国崛起更加重要。他由此勾勒出中国在人工智能竞争中的优势条件:基础设施建设、人才培养、促进研发和应用扩散的国家战略等等。 [5]这项研究将舆论特别关注的创新的“先进性”与“后发性”的对立,引向了更重要的“创新能否获得广泛应用”这个层面上。
事实上,DeepSeek-R1之所以能在短时间内搅动全球眼球,除了基于所谓“后发国家企业挑战美国科技巨头”这一话语之外,更重要的还是大幅度降低应用成本并采取开源的技术路径,这两点使得各行各业都有了基于自身发展需求来尝试使用这个新兴科技产品的机会。
李飞飞曾批评,当前人工智能的成就在很大程度上依赖公共资源的历史投入与积累,例如目前的互联网和人工智能科技公司多使用PyTorch的开源软件平台,没有这个公共资源,就不会有ChatGPT和Claude这样的科技产品。
然而,OpenAI和Google开发的大模型,虽然不同程度借助了开源资源,而且非常依赖海量的公共语料库,但是却越来越封闭,很少生成新的公共产品。 [6]这个批评意见其实是业内共识,在经受DeepSeek-R1冲击之后,OpenAI首席执行官奥尔特曼(Sam Altman)也承认选择闭源路线是错误的。DeepSeek正是充分展现了人工智能的非线性创新特性,由此是更值得提倡的技术路径。
三、激励人工智能多技术路线探索的公共政策
红线
从DeepSeek的实践经验能够获得启发:切实激励人工智能多技术路线探索,是我们公共政策当前最需要着力的方向,以此才能真正满足多元丰富的经济社会发展需求。
从中央到地方近年的一些政策,显示了激励多技术路线探索的意图,其理论意义和实践意义值得持续挖掘。
例如,一方面,中国的人工智能发展战略显示了非线性创新观的理念,如国务院2017年7月印发的《新一代人工智能发展规划》,提出了围绕不同的应用需求而一体化配置研发、应用和产业培育力量; 另一方面,工业制造、建筑建材、农林牧渔等领域提出的政策主张,深刻表明了探索多技术路线发展的需求,如广东省工业和信息化厅2024年1月印发的《2023年全省工业和信息化发展情况及2024年主要工作计划》,住房和城乡建设部2024年2月通过的《“数字住建”建设整体布局规划》,农业农村部2024年10月出台的《农业农村部关于大力发展智慧农业的指导意见》,等等。
DeepSeek在探索更低成本、更便于适用、更为开源的科技产品路径方面的经验,增强了以非线性创新观为指导、激励多技术路线探索的政策的现实可行性,这种政策可以成为发展嵌入不同行业的人工智能的保障。
进一步的配套性政策可以提供更多的支持:一方面拓展应用场景,让不同的科技理念和产品得到应用端检验的机会;另一方面激励学术界同产业界深度合作,既共同解决应用问题,又从应用过程中提炼科学问题,推动实现科学原理的新发现。
*本文作者:蒋余浩 华南理工大学公共政策研究院研究员、广东新质生产力政策研究中心主任
(点击图片阅读更多蒋余浩的文章)
参考文献:
[1]格申克龙 A. 经济落后的历史透视[M]. 张凤林,译. 北京: 商务印书馆,2009:53-59.
[2]Keun L. Innovation—Development Detours for Latecomers[M]. Cambridge:Cambridge University Press, 2024.
[3]陈玲,孙君,付宇航. 政策协调、不确定性与大型技术系 统创新——中国核电技术赶超的案例研究[J]. 公共政策评 论,2024(03): 3.
[4]Narayanamurti V, Odumosu T. Cycles of invention and discovery[M]. Cambridge:Harvard University Press, 2016:54-55.
[5]Ding J. Technology and the rise of great powers[M]. Princeton and Oxford:Princeton University Press, 2024: 195-203.
[6]GTC李飞飞专访:再谈AI变革,呼吁AI资源公共化[EB/OL]. [2025-02-21]. https://baijiahao.baidu.com/s?id=1823904 926054214005&wfr=spider&for=pc.
IPP公共关系与传播中心
排版 | 周浩锴
审阅 | 刘 深
终审|刘金程
光明日报|DeepSeek“破圈”意味着什么?
DeepSeek“出圈”下一步:我国如何构建AI新变革与创新环境?
蒋余浩:中国人工智能创新发展路径研究——基于“非线性创新观”的探索
关于IPP
华南理工大学公共政策研究院(IPP)是一个独立、非营利性的知识创新与公共政策研究平台。IPP围绕中国的体制改革、社会政策、中国话语权与国际关系等开展一系列的研究工作,并在此基础上形成知识创新和政策咨询协调发展的良好格局。IPP的愿景是打造开放式的知识创新和政策研究平台,成为领先世界的中国智库。
热门跟贴