文 | 天书 土曹 北方朔风
自从去年chatgpt4出现以来,以大语言模型为主的AI和星舰一样,在中文网络上愈发被一些群体当成美国对中国的某种决战兵器而极尽吹捧。比如最近风头正盛的某“经济学家”一直在各种场合鼓吹AI将带领美国实现产业升级。
无论这些人愿不愿意承认,对美国这样的霸主来说,越被吹捧一两样“决战兵器”,越意味着在总体性竞争优势上已经乏善可陈。退一步说,我们先假设AI或许在未来能产生决定性作用,那么鼓吹“AI决战”,起码也要先大概了解中美之间目前的AI差距现状,以及未来的胜负手在哪。
实际上,今年OpenAI的进展就不如市场预期,年初高调宣传的视频生成模型sora迟迟无法落地,反而是国内的可灵,即梦等相继实现对公众开放。前两天腾讯刚发布的视频生成模型混元Video参数量达到130亿,据称是当前最大的视频开源模型。
混元”文生视频“示例
一方面是国内AI模型们不断追赶和商业落地,一方面是gpt遭遇瓶颈。就在上个月,OpenAI内部下一代gpt模型“猎户座”被曝提升不及预期,已进入收益递减阶段。一位OpenAI的工程师表示,“接下来的工作中科学创新将会变少,将由多年的艰苦工程代替。”
从算法创新到大力飞砖
什么叫科学创新将由艰苦工程代替呢?意思就是说大模型这个路线未来的性能提升会越来越依赖于工程实现和物理条件本身,而不是算法工程师们的天才创新。
在AI突破的道路上,到底是算法重要还是算力本身重要,并非一开始就有个明确的答案。直到2018年以前,业内对算力的重要性还只有一个模糊的认识,知道重要,但具体重要到什么程度并没有人真的去估算,很多人还是寄希望于能够出现更神奇的算法。不只在算法上,一种看起来非常有希望的方向是将人工智能与前沿哲学结合起来,通过哲学层面对语言,心灵和意识的研究指导人工智能更靠近“人类思维”。
不论东西方,在相当一段时间内都流行过“哲学能指导科学发展”的迷思。在欧洲来说,哲学和自然科学的分家早些,虽然哲学发展至现代阶段后,从逻辑实证主义到现象学都声称要给科学大厦找到一个可靠的基础,但科学家们对此往往并不予理会,大概就像杨振宁说的那句“哲学从来没有影响过物理学”。在社会主义国家来说两者的关系更复杂些,从恩格斯的《自然辩证法》到苏联官方唯物主义哲学再到我国的《矛盾论》,在历史上都或多或少的参与进了科学研究的方向性规划中。
在人工智能研究兴起之后,哲学与科学之间的关系一度迎来转机。人类是目前已知唯一有真正智慧的事物,研究人工智能自然首先离不开对人脑结构和思维模式的模仿,比如神经网络就是模仿人脑的神经元。在人类思维模式,逻辑结构,意识、语言、智慧的本质为何等方面,就来到了现代哲学强相关的领域。20世纪西方哲学的几个主要转向——分析哲学,语言哲学和现象学中,对这些领域都有多方深入。
1956年的达特茅斯会议被视为人工智能作为一门学科的诞生。如罗素,乔姆斯基,查尔莫斯等哲学家的理论成果在人工智能研究的不同阶段都产生过不小影响(当然,这种影响中也包含了一些误导)。70年代之后,人工智能热潮进入第一次低俗。后来经过专家系统,统计学习等阶段性发展,人工智能进入了深度学习革命时代,从心灵哲学,具身现象学到更具体的人工智能哲学等等,哲学与人工智能相关研究的结合一度被寄予厚望。
达特茅斯会议上七位主要科学家合影
由于互联网为代表的信息科技浪潮在新千年后处于极强势的地位,这导致哲学对人工智能研究的参与对哲学界本身造成了反向影响——人工智能代表了人类社会的未来,既然一些哲学(看起来)能指导人工智能研究,但还有很多哲学不能,那么是不是意味着那些不能的哲学已经落伍了?由此,那些与人工智能无关的哲学一度在某种层面面临被讨伐的局面。比如在我国,英美分析哲学的一些学者就借AI热潮试图对官方马克思哲学提出挑战。
然而在2018年之后,情况出现了变化。
在之前,也不是没有人工智能学者像物理学家那样质疑过哲学对人工智能的真正作用,由于两波人对彼此总是存在着这样那样的不够深入和误解,让这种争论更像嘴仗,一直没有一个明确的结论。2018年,OpenAI发表了一篇文章,估算自2012年以来,最大规模的AI训练中所使用的计算量呈现出指数级增长的趋势,其计算量每三四个月就要翻一番,并作出结论,认为现有的模型只要加大算力和数据,就一定会有更强的效果,loss(模型预测的准确度损失)会更低。想不想看到loss低到一定程度后,模型会出现什么改变?那就大力飞砖吧。
正是清楚认识到这一点,并且坚决在算力投入上狂飙突进,OpenAI奠定了率先突破的基础。在我们今天看来,算力越大模型效果越好仿佛理所当然(也并非都如此,那些将AI视为美国决战兵器,认为美国AI水平不可超越的人很明显对这方面没什么认识),但在当时来说,模糊的认识并不等同于清晰的决策和坚定的投入。毕竟在算力上大力飞砖,需要的投入是天文数字。
而且就像摩尔定律和安迪-比尔定律那样,信息技术总是先出现明确趋势,后被总结成规律。虽然从2012年开始计算量每三四个月就翻一番了,但总要有人明确归纳总结并进一步实践,才能成为行业的金科玉律。还有一个重要因素现在大家也很清楚了,就是在人工智能计算方面GPU对CPU的取代引发了技术变革,让大力飞砖得以有实现的基础。
在推动人工智能进步的经典三要素中,算法创新和可用于训练的数据质量往往很难被量化和客观评估。算力大小简单明了,其重要性一旦被直观指出,那接下来的事情无非是军备竞赛。由此,这轮以大模型为代表的人工智能热潮从科学创新更加走向工程实现。
中美AI的人才和软件差距
通过上面对哲学与人工智能间的关系,以及从算法创新到大力飞砖的工程转向过程的梳理,相信读者会对某些群体的“AI决战兵器思维”的本质有更深入的认识。几十年来,中国的生产力和工业水平越是发展,那些否定中国的理由就越来越虚无化玄学化。像这类“美国AI不可超越”的认知,根据并不从科学,产业和现实中而来,而是因为那些人坚信不移“美国有某种迷之优越性”。如果说,真是英美分析哲学的传统促成了AI的突破,让我国在这方面被甩开,那这些人的迷信还可能找到一些依据,然而现实结果并非如此。
还有一个美国AI迷信者们更不愿意接受的事实,实际上从学术人才储备和软件上,中美差距并不大,比被卡脖子的GPU差距要小得多。
从这两年各个AI方向的会议和期刊的发表上来看,不乏包含了中文名字和国内单位的文章发表。特别是在计算机视觉和自然语言处理等领域。很多顶级会议有近一半以上的文章都是出自国人或者华人的手中。也有不少的小领域,我国雄踞前沿。曾经有机构统计,全球人工智能研究论文数量排名前五的机构都是以中科院为首的中国机构。
一个老生常谈的话题是,我们虽然发表的论文很多,但是综合质量并不高。这种不高并不是指这些文章质量不行,相反,这些文章可能质量都并不差。只是缺乏那种足以影响整个领域或者小领域和研究趋势的文章,很多学者还更像是在做题而不是在做学术。当前这种情况也在改变,整体研究和科研产出的质量也在逐年提高,国人产出的高引用率论文正在越来越多。中科院,清华的产出甚至可以和斯坦福,麻省理工,谷歌之类的一较高下。而且别忘了,就像美国吸收了全世界大量优秀人才那样,人才这种东西是有流动性的。
的确,在AI领域从0到1的研究,美国还是当之无愧的佼佼者。我国紧随其后,虽然在最前沿的技术上还比之有所不及,但是并非没有自己的突破和闪光点。像今年年中斯坦福抄袭国内清华开源的大模型事件,也反向说明我们其实也做出了很多优秀成果。
开源之前一向被看作美国互联网产业的优势,事实也确实如此。目前训练模型用的开源框架仍然由美国互联网产业主导,如Pytorch,deepspeed,以及当下使用最多的,英伟达主导的megatron。
不过因为成本和商业壁垒的关系,美国头部的人工智能公司开源并不积极,马斯克骂完OpenAI不开源,自己的新版模型也放弃了开源。目前在开源和创新上,我国AI行业反而更展现出活力,不少人工智能公司都积极拥抱了开源,如腾讯混元,阿里通义千问,深度求索,智谱智能,面壁智能等。
在创新上,智谱智能的GLM系列就在构架上有所创新,我国个人开发者开发的RWKV模型,更是超出了Transformer模型的限制,甚至被微软拿来使用。深度求索开发的deepseek系列模型,通过对MOE模型的优化,降低了大模型的使用成本。至于在具体商业和个人应用层面,我国这两年也已经是遍地开花了。
就开源软件的差距来说,目前国内AI整体还处于从1到100的阶段,短时间目标只是追上美国与其并驾齐驱,这方面差距影响暂时不严重。等我国有一天要向美国发起科技潮流引领地位发起挑战,进入从0到1的阶段时,这方面的影响才需要更加重视。
胜负手:物理限制
就像前面所说,当前大模型的突破根本上是由算力而不是算法决定,且中美在AI人才和软件上的差距并没那么大,不足以够成中美AI竞争的胜负手。
算力推动大模型发展,算力本身由三者综合决定,以GPU为主的芯片先进程度,更先进算力数据中心的工程实现和能源供应。目前在推高算力上,中国在眼下面临物理限制,美国在未来面临物理限制。
中国的限制
中国眼下面临的限制人所尽知,就是在GPU上被美国卡脖子。从特朗普第一任期以来的科技封锁就不回顾了。眼下,最高端的显卡美国人是绝对不会卖给我们的。现在能买到的显卡就只有L20和H20之类,单卡训练上的性能只有A100的一半(可能还不到),粗略估计的话,多卡可能达到A100的80%的水平。但A100已经是英伟达两代之前的东西,现在已经到了H200和GB200的阶段。就在12月2日,美国又升级了对华半导体管制,140家企业被列入“实体清单”,这方面我们不能也不应该对美国有什么幻想。
性能是一方面,数量是一方面。2021年前后,OpenAI就把同时启动的训练节点扩展到了7500个,到今天国内能同时启动这个量级训练的公司还不多。除了资本投入和工程经验上的差距外,最直接的因素是显卡数量,国内的万卡集群还是停留在少量头部公司以及公立实验室中。
本土GPU制造上,华为们虽然在努力追赶,但仍要时间。当然要看到这方面我们有追赶的机会。我国芯片制造业的持续突破是一方面,当下摩尔定律已经逼近失效,芯片性能的提升在相当时间内不会像从前那样突飞猛进。另外从昇腾的发展轨迹来看,得益于我国庞大的产业规模,确实哪个领域被封锁,哪个领域的国产替代化就会加速进行。基于我国在能源和基建水平上的绝对优势,一旦在GPU方面突破了卡脖子,算力将迎来跨越式发展。
美国的限制
美国面临的物理限制则是由去工业化造成的不断衰退的基建能力,严重老化的电网,以及核能、清洁新能源方面的产能落后。这些问题对AI产业来说,在今天看来还不很严重,但趋势已经明显。
举几个基建影响的例子。随着AI模型越来越大,相应算力产生的热量消耗越来越高,数据中心需要实现良好散热才能维持运转。散热本身也需要消耗大量的水和电,大型数据中心有近一半的运营成本就来自散热。为了降低成本,将数据中心建在气温较低的地方自然是理想选择,像我国内蒙和贵州就有不少数据中心集群建设。
对于我国来说,建在哪里基建都不会有什么大问题,但美国不是。像阿拉斯加的气候无疑足够凉爽,但当地的基础设施支持数据中心建设么?所以美国大量巨型数据中心不得不建设在居民区附近,以至于出现和当地居民争水争电的问题。
还有数据传输方面。百万GPU级别的超级集群是单体数据中心不能实现的,需要多数据中心的互联,因为大语言模型训练的特性,多中心互联对延迟有着非常严苛的要求。当然,美国的大公司们有能力搭建属于自己的专线,但是这样的垄断对于后面进入市场的人工智能企业是不利的。而我国在布局数据中心集群的时候,把低延迟线路专门放进了配套基础设施规划中,参与的企业都能享受到这样的基础设施。
这些还不是致命问题,AI的性能提升意味着能耗的成倍增长,能源问题是决定美国未来在AI上能否继续领先的命门。美国电网的老化目前看不到什么扭转迹象。而且由于欧美这些年的环保大旗,对数据中心的环保指标有着严格要求,这要求人工智能玩家们必须更多使用核能,风电光电等清洁能源。
在核能上,看微软前段时间打算为了AI重启三里岛核电站就明白目前美国是什么现状了。一方面是美国现在对建设新核电站审批很困难,一方面也是无奈之举。毕竟美国最近二十年核电建设不顺利的根本原因并非是技术,而是建设周期过长导致成本超支。如果按照美国之前的经验,现在新建新式的反应堆,虽然安全性更好,但是建成就要到2040年代了,需要电力的人工智能公司可等不了这么久。
而且我国目前除了众所周知的光伏优势外,在风电机组制造,电池制造,碳捕集、利用与封存,绿色建筑材料方面都已处于世界领先位置,其中光伏、风机、锂电池这三个部分,中国目前掌握了全球绝大多数产能。在其他的如核能发电,储能技术,氢能和燃料电池,生物能源等产业上,虽然不是非常领先,但也是发展很快,有了可观的技术积累。
我国的核电技术达到了国际先进水平,目前建设的第三代核电站,相较于冷战时代的老电站安全性有本质的提升。正在开发的第四代核电技术上更加先进,工程上的经验也使得建设周期可以控制在合理的区间之内。更不用说中国的火电超低排放技术和清洁煤电体系也是世界领先。
基于以上这些优势,我国建设了世界上最大的综合电网,这是人类工程历史上的奇迹,同时也实现了全球最大的清洁能源装机量。这背后,整套电力系统的协调无疑是居功至伟。比如,我国之所以能将大量的清洁能源纳入电网,同时不影响使用,除了科研人员花费巨大精力建设的电力调控系统外,跨区域的输电,用于调峰的电站,大型储能设备也是核心所在。为了搭配这些清洁能源,我国近十年来也建设升级了一大批新的电站。
类似的事情实际上从纯商业效率来说未必赚钱,美国电力系统面临的问题也在这里,都想做赚钱的生意,不考虑不赚钱的问题。只不过如果从社会整体的角度来考虑,基础设施不能只考虑赚钱,我国从社会整体考虑的电力系统的建设,现在被证明显然是有利于社会长期发展的。
以上,中美AI竞争中物理限制的胜负手就很清晰了,中国要在眼下突破芯片制造,以及相关先进技术的卡脖子,美国要在未来解决去工业化带来的电网老化,基建和能源技术落后的问题。谁先解决问题,是谁能领先迈入AI发展下一阶段的关键。
胜负手:应用场景
正如现在很多人对大模型AI吐槽的那样,人类发展AI并不是为了让它们代替人类下棋唱歌画画,而人类继续苦逼干活。AI最终还是要落实到生产环节,以及社会和生活的具体场景中。
生产环节这方面显然中国有领先优势,毕竟许多产业已经不在美国本土了。社会应用场景上,中美作为两个经济体量最大的国家,在AI应用上目前各擅胜场。这里仅说说我国的情况。
我国的人工智能企业目前在应用场景上走的稳健路线,开发了大量行业大模型,金融,气象,政务,矿山,航空航天,医疗等各行业的大模型。这样的路线听起来不那么带感,但很现实。在人工智能无法实现无所不能之前,针对各个行业的工作去开发专有模型是个更加有效的策略。毕竟就算是openai,也开放了允许进行微调的模型范围。
除了大语言模型之外,其他的人工智能技术我国的应用也走在前方。无论是自动驾驶,智能安防还是ai for science,我国都保持在世界前列,甚至类似人工智能安防这样的领域,保持着世界第一的水平。我国企业与院校在应用这些技术的主动性上是无需怀疑的。
在应用场景上,眼下美国有一大领先胜负手,就是ai for science。由于美国在基础科学研究和AI水平上同时保持领先地位,所以在ai for science,也就是人工智能推动科研上目前有领先优势。如deepmind虽然位于伦敦,但属于谷歌旗下,也可以算作美国AI产业,这个机构做了大量的AI跨学科应用研究,比如今年获得诺贝尔化学奖的alpha fold,以及在核聚变方面的研究应用。
当然,AI对基础科学的推动到底能到哪一步目前谁也不好说,相关问题我们在今年关于诺奖的文章中已有所讨论。虽然概率不大,但谁也不能排除哪天AI真的给人们带来天顶星式的科技突破,所以这方面是需要我国持续追赶的。
最终胜负手:社会变革
对中美两国当下的AI发展差距做一个简单总结。打个比方,如果全球各国是一个班,那么AI这条的赛道上,目前来说只有中美两个学霸和剩下一大票成绩一般甚至很差的同学。如果说美国是90分,我国是75分,那其他国家可能大多数都还处于30分到50分之间状态。欧洲在这方面已经跟中美有很大差距(欧洲AI从业者也有大量的华人),日本更排不上号。
国内在基础大模型上足够对标mistral的初创公司就有六七个以上,还有大量的互联网公司和科研单位。更何况我国可以说在从硬件到软件的整个链路上都有涉猎,很多领域也都完全自研,甚至部分处于世界先进水平。现在的劣势主要还是美国凭借全球供应链的优势对我国进行打压。
现在我们要思考最后一个问题。以上种种差距以及胜负手的讨论,都建立在文章开头的那个假设上,即“AI或许在未来能产生决定性作用”。然而AI的作用一定是正向的吗?
美国少部分AI从业者认为,人工智能不用管是最好的。但是技术的野蛮发展带来问题,历史上已经有了太多的例子。而人工智能可能/已经带来的问题已经有不少了:大型数据中心的环保问题如何解决;人工智能用有版权材料进行训练,再拿来赚钱,是否合适的问题;人工智能带来的失业问题如何处理:深度伪造技术制造的假消息对社会有什么影响……
这些都是十分现实的问题,不是不用管就能解决的。这些问题放着不管,只会让问题越来越大,反对人工智能的人越来越多,这不是我们希望的人工智能发展的方式。而这些如何解决,并没有什么标准的答案。
在这一轮大语言模型浪潮爆发之初,我国就提出了人工智能管理的相关条例。当时有少数人对此十分不理解,但是事实证明各国都提出了类似的条例,人工智能管理势在必行,制定这方面的条例也是必然。不过美国制定这方面的条例的时候,态度显得有些不诚实。比如说有法案试图限制开源模型,理由就是因为中国,这样以中国为借口打压同行的事情,显然是属于过度管理的,而且也没管到实质问题。
我国的相关条例,在保证管控风险的同时,也保持了足够的灵活性,让人工智能进行发展,同时对于新出现的问题,也保持着见招拆招的余地。而诸如环保这样的问题,我国也确实能从技术上给出解决方案,不像是某些公司,做着烧天然气也要搞人工智能这样虚伪的事情。
以上这些问题还是AI发展带来的表层性问题,欧美左翼学者,如齐泽克和乔姆斯基等已经不只一次批评过人们对人工智能的预期。我们就算不从左翼角度看,今年最新的诺贝尔经济奖得主达龙·阿西莫格鲁是经济学领域研究AI的代表性人物,他就对围绕AI对生产力和经济增长的一些过度乐观预测持怀疑态度。
今年6月,阿西莫格鲁在接受国内媒体专访时提到,越深入研究AI的能力和发展方向,越确信它当前的发展轨迹正在重复并加剧过去几十年最糟糕的一些技术性错误,他非常担心AI成为将财富和权力从普通人转移到一小群科技企业家的方式,认为出自动化造成的不平等是企业和社会在选择如何使用技术后导致的结果。
正如阿西莫格鲁担心的那样,对AI的错误使用会加剧社会的不平等,如果AI真的能朝着通用人工智能的方向不断迈进,并深入介入社会生产关系之中,那么在社会没有进行相应深度改革的情况下,很容易会极大加剧社会矛盾。
所以,AI浪潮真正深远的影响在于需要推动社会同步进行改革。在这方面,我国面临着艰巨的历史考验。一方面自然是因为我国工业产值已经占到全球30%;另一方面,生产力的质变要配合生产关系与社会形态的转变。
从90年代开始,中国从政府、社会到群众,对信息技术的拥抱就从来没迟疑过。今天的中国可以说是世界上最推崇技术进步主义的国家,最庞大的生产体系结合最坚定的技术进步主义,在AI普及之后必然催促着社会变革的到来,逼迫我们的社会必须坚定朝着更加平等的结构迈进。
对美国来说也是如此,当前欧美尤其是美国,已经越来越多的出现拒斥自动化信息化,以及反智主义的倾向,在政治上也开始回归保守。当下很多美国人对于人工智能技术的态度相对保守,也并非是他们不理智,而是曾经的新技术发展,给他们带来了许多问题。然而,其他国家可以技术保守,对全球霸主美国来说,一旦陷入技术保守,就会无力再维持军事和美元的统治地位。
从特朗普高喊工业回流开始,美国制造业占全球比重已经下降到12%,在政治,经济和军事手段都失效后,也只能把再工业化的希望寄于AI”玄学“。同样,想靠AI推动产业起死回生,美国社会就必须下猛药改革,甚至是革命,美国从上到下做好如此心理准备了么?
或许美国也可以尝试硅谷目前流行的新技术右翼思潮,这种思潮认为在马斯克这样的少部分科技精英带领下,技术进步能解决一切问题,只要美国政府和人民完全不约束他们。这是人类历史上还从来没有出现过,只在小说影视里才有的道路,我们也可以拭目以待。不过显然无论能否实现,这个路必然是以大多数美国人的利益为代价的
当前这个世界,选择发展就要面临全新的挑战,不发展走老路回归保守又看不到出路。在这样的情况下,可能诞生于未来的更加通用的AI,或者说AGI就会像一把双刃剑,想真正靠它取得胜利,就必须要有直面可能砍向自己的勇气。无论如何,我们可以确定知道的是,正是我们的国家和人民在几十年坚持不懈的奋斗中,对发展从没有犹豫和后悔。
近期文章导读:
热门跟贴