李萌：对我国人工智能发展几个新现象的观察与思考|人工智能领域|人机交互|智能体|机器人|李萌(1963年)|神经网络

大模型和生成式人工智能引领的全球新一轮人工智能（AI）科技新浪潮持续升温，国内外大模型技术的进步一浪高过一浪，产业竞争日趋激烈，落地应用不断深化。进入2024年，我国人工智能发展表现出一系列新现象、新趋势，值得我们重视和持续关注。

近期国内人工智能发展的几个新现象

我国大模型发展早期重心主要集中在基础模型能力追赶，2024年以来产业化落地开始成为各界关注的新热点，在垂类大模型、数字人、具身智能、AI for Science（人工智能驱动的科学研究）等方向上新进展新成效不断涌现，同时，更好地平衡发展与治理，推动人工智能治理落地也成为新时期的关注重点。

（一）垂类大模型应用呈现明显加快趋势

当前，大模型大规模商业化的难题在国内外都还没有得到完全破解。中国的大模型产业化之路与美国有很大不同，产业垂类模型的发展更快。2024年以来，众多大模型研发团队开始投入力量，利用与特定场景相关的专业知识通过对基础模型进一步训练或“微调”，提供针对特定业务场景的高质量专业化解决方案，可以更好地完成特定任务。如华为和湘潭钢铁集团联合开发的盘古钢铁大模型获得国际电信联盟（ITU）全球人工智能优秀创新大奖，这个模型赋能宝武钢铁数字化转型，实现降本增效，一年单炼铁环节就能节省10亿元。国家电网研发的配网视觉大模型已经在无人机巡检、通道可视化等几十个配网场景应用，完成30万公里巡检，平均识别效率提升10%。除此之外，一大批工业大模型、矿山大模型、物流大模型、港口大模型，还有医疗大模型，已经开始在各自领域不断深化落地，发挥其领域纵深优势，将对中国的产业特别是制造业进步带来重大影响。

（二）数字人初登舞台发展迅速、涉及面广，这是AI应用中的新事物

大模型推动数字内容生成能力和图像、语言、文本多模态处理能力加速成熟，数字人在人物形象、语音生成、动画生成、音视频合成显示、人机交互等方面带来了惊艳体验，活跃在教育教学、看病就医、金融服务、电商购物、线上直播、客服推销等商业场景，也在名人纪念等大规模场景中应用。比如，2024年“6·18”京东启动了超过18位品牌总裁数字人分身亮相直播间，蚂蚁灵境数字人平台助力央视财经打造两会AI主播，中国科学技术出版社研发医学领域的数字人开展科普宣传等。《2024年中国虚拟数字人产业发展白皮书》预计，到2025年我国“数字人”带动的产业市场规模和核心市场规模将分别超过6 400亿元、480亿元，比2023年增长超过90%、130%。

（三）具身智能在人工智能发展进程中的地位明显上升

2024年以来具身智能成为国内各类重要论坛讨论的热点，成为各类研究机构布局的优先考虑，成为人工智能相关企业和风投机构投入的重点。多模态大模型是具身智能发展的关键动力，实现与环境互动和交互式学习进化能力。在语言对话、数字内容生成之后，进一步挖掘Transformer大模型在多任务学习和多模态方面的潜力，将多模态大模型、强化学习与机器人的感知、行动和环境交互等能力结合，实现与周边环境进行自然交互并完成各种任务的具身智能，正在成为后大模型时代的人工智能新形态，也被很多人认为是通向通用人工智能的必经之路。国内一批具身大模型快速涌现，比如达闼科技率先推出的多模态具身大模型RobotGPT、有鹿机器人研发的第二代具身智能技术LPLM大模型，以及若愚科技推出的若愚·九天机器人大脑，均利用多模态大模型实现人类意图理解、高频人机交互和复杂任务规划等功能。高级别自动驾驶、仿人机器人等都将受益于具身智能的突破而实现新的能力飞跃。

（四）人形机器人率先出现发力提速态势

人形机器人是具身智能的典型产品概念，也是具身智能技术发展的载体，大模型的场景泛化能力以及具身智能技术的爆发对功能更加通用的人形机器人发展带来巨大驱动力。尽管国内外人形机器人都还处于低版本的具身智能状态，但技术迭代很快。人形机器人在大脑、小脑、空间智能、肢体与上游核心部件等热点方向并行前进，机器人本体、核心零部件、软件算法方面的国产厂商涌现，正在不断形成创新成果。比如宇树科技的Unitree G1人形机器人采取具身智能路线摆脱了预先算法编程，增强与物理世界互动能力，斯坦福大学以宇树科技的国产硬件平台为基底研发了HumanPlus人形机器人；智元机器人“远征”系列通用型具身智能机器人开启了商用量产，结合临港集团等制造场景探索人形机器人商业化落地。清华大学、上海交通大学、浙江大学等一批研发团队也在人形机器人领域快速跟进，形成一批前沿性技术成果。

（五）人工智能驱动的科学研究关注度快速提升

以大模型为代表的人工智能技术的复杂问题求解能力将突破传统科学研究的瓶颈。近年来，采用人工智能解决科学研究问题受到越来越多的关注，人工智能驱动的科学研究（AI for Science）在基础研究和医疗、材料、生物、化合物等领域的研发和应用在我国快速展开，科研人员沿多条路径探索大模型在科学研究领域的落地应用，尤其是结合大模型技术潜力开展各领域科研知识增强和设计增强的进展引人注目。比如，鄂维南院士团队研发了国际首个覆盖元素周期表近90种元素的多体系统一高精度预训练模型（DPA-2），北京深势科技发布了通用三维分子表征预训练模型Uni-Mol+，中国石化研发的“天枢”智研化工大模型可完成分子智能化学检索、分子逆合成设计和反应条件推荐与优化等场景研发任务。

（六）人工智能治理从倡议走向落地

新一轮人工智能浪潮推动人工智能新技术更快速地进入社会生活，巨大的能力也带来潜在的风险，正在对伦理、安全、隐私、公平等各方面治理提出迫切需求。中国不断发出呼声倡议，明显促进了国与国之间共识的形成，带动了研究机构和学者交流的增强。如2024年3月在北京举办“北京AI安全国际对话”、5月中法两国联合发布《关于人工智能和全球治理的联合声明》、7月《人工智能全球治理上海宣言》在上海发表等。同时，政、产、学、研各界加快推动倡议落实，上海人工智能实验室开拓治理落地新思路，实验室主任周伯文提出探索人工智能45°平衡律，主张在推动AI技术性能提升时同步构建更强的安全技术体系；学术界提出多份人工智能立法建议方案，探索建立人工智能治理制度的中国路径；人工智能领军企业积极落实倡议要求，推动人工智能治理在产业实践中落地。

对这些新现象的进一步思考

随着大模型技术日新月异、迭代发展，人工智能技术和产业形态将加速演化，通用人工智能的路径正在变得更加清晰，人工智能新场景新实践将在我国大量涌现，为新质生产力发展注入强大动能，同时我国人工智能治理的对外影响力也将不断提升。

（一）“基础-垂类”协同并进、“大型-小型”融通适配、“中心-边缘”梯次接续的模型体系正在形成

基础大模型的通用泛化性与专用大模型的高度专业性各显优势，融合互补将成为未来趋势，“两条腿走路”的方式已经有了共识。下一步大模型将沿不同方向多元化发展。首先，领军企业和研究机构继续拓展基础模型规模，提升数理、因果推理等高阶能力，探寻Scaling Law的科学边界，比如2024年9月OpenAI发布的o1-preview被认为再次推高了大模型规划推理能力的天花板；其次，更多的企业会面向特定任务或场景打造垂直模型，在泛化性与专业性方面实现更好的平衡，加快大模型的产品化和落地；最后，2024年以来国内外大模型“小型化”竞争已经开启，发挥效果、性能和成本综合优势，小模型将开拓手机、PC、耳机、音箱以及其他可穿戴式终端等广泛场景。中国大模型产业化已经形成通用类大模型与专业类大模型并行发展的态势，面壁智能、百度等陆续发布一批小模型并快速迭代成熟，下一步有望发掘丰富场景和专业领域数据潜力，在“基础-垂类”协同并进、“大型-小型”融通适配、“中心-边缘”梯次接续的模型体系方面走出优势，并率先催生实体经济领域代表性模型的落地应用。

（二）具身智能有望成为打通物理AI的突破口

人工智能对实体经济的深度赋能需要打通数字智能与物理智能的桥梁，应用到工厂、交通、通信、电网等各类物理设备和基础设施，提升其自动化和智能化水平，连通数字世界与物理世界。未来五年内，自动驾驶将成为物理（具身）智能领域中最重要的应用之一，有望成为第一个通过“新图灵测试”的具身智能系统。按照这个趋势，自动驾驶汽车、人形机器人、低空智能运载工具，也可能成为未来5～10年自主智能领域的“新三样”。从离身智能走向具身智能的过程中，高级认知能力也将逐步露出苗头。人类智能、离身智能、具身智能协调发展是今后人工智能发展的主线，人工智能可控可信发展必须把人机协调贯穿于始终。这一方面需要不断地研发和技术迭代，另一方面也需要政府、企业、社会保持良性沟通互动形成共识。发展具身智能体将成为我国新质生产力建设的一个战略通道。

（三）实现通用人工智能的路径变得更加清晰明确

大模型技术改变了语音、视觉、自然语言处理等多个人工智能细分领域的研究范式，符号主义、连接主义、行为主义有望在大模型及具身智能体的框架下实现融合统一，对通用人工智能的能力走向及下一步发展路线的讨论也正在成为学术界新的热点话题。比如OpenAI提出了人工智能发展的五个级别：一是聊天机器人，即对应当前AI水平，可以与人类对话的人工智能；二是推理者，即像博士一样解决问题，无需工具的人工智能；三是智能体，即可以代表用户采取行动的人工智能代理；四是创新者，即可以创造新事物的人工智能；五是组织者，即可以完成整个组织工作的人工智能。其新发布的O1-preview正是OpenAI沿这一路径研发的第二级产品。国内姚期智、潘云鹤、张钹等领军科学家也对未来人工智能的研究和发展方向做出了判断和预测，北京智源人工智能研究院理事长黄铁军提出新的通用人工智能水平和风险分级方法。尽管视角有所差异，但反映出业界对于通用人工智能的理解更加清晰明确，行业引领者也开始把长远的雄心阶段化、具象化甚至产品化，这将加速通用人工智能的实现。

（四）大模型场景创新将开创一批智能产业新机会

大模型技术进步加速了人工智能场景创新，深度改变行业生产力，有望激发新一轮人工智能产业化浪潮。大模型已经率先在AIGC领域产生大规模产业应用，未来将影响金融、媒体、法律、市场研究、教育、客服等十余个行业；Agent智能体将取代搜索网站、取代很多软件和应用程序；网络操作系统面临一次大改造，智能操作系统会逐步孕育成形；人工智能向手机、平板和PC产品的渗透率将快速提升，稳定多年的信息通信产业将面临重构。人工智能驱动的科学研究（AI for Science）在生物、医学、气象、化学等基础研究方面的巨大潜力已经在学术界得到高度共识，随着大模型等前沿技术与AI for Science场景的进一步融合，人工智能有望加速重大科学问题研究和知识发现，在产业界技术创新和工程创新中释放变革性价值，推动工业设计、流程优化调度、智能工厂等形成新的能力突破，将大幅度提升我国制造、医药、材料、能源等众多行业的创新效能和创新水平。

（五）人工智能发展还将迎来更强技术范式

当前大模型仍面临一系列能力瓶颈，可重复性、幻觉等问题制约了大模型向具有更高稳定性要求的场景拓展和商业化落地，探索更加可信可靠的技术形态将助力大模型下一步落地应用。尽管目前大模型规模效应依然奏效，推动大模型能力曲线持续攀升，但很多专家并不认为仅仅依靠当前架构就能够实现世界模型，如学者张亚勤提出未来五年内会在AI技术架构上有大的突破，Transformer会被逐步重构。创新性神经网络和学习方法正不断被科学界提出，有可能为通用人工智能发展提供新的理论范式。随着大模型计算需求飞速增长，人们对量子计算等新型计算给予的期望越来越高，量子计算纳入人工智能视野并得到重视，量子人工智能的新范式正在吸引国内越来越多的研发力量，未来有望不断取得新进展。光计算也在为人工智能发展开辟更多新路径，戴琼海院士课题组提出了新型光计算架构，提供了大规模神经网络精准、高效的光计算训练方法，并推出了“太极-II”通用光训练芯片。

（六）中国在人工智能治理合作中的引领角色将进一步提升

人工智能不仅是改变人类生活的新技术，更引领了一场前所未有的具有强大冲击力的社会革命，深度影响人们的认知，深度改变新闻、科研、教育等领域的工作模式，需要新的治理理念、制度设计和治理规则引导和规范技术发展，而人工智能技术自身所独有的自主性、涌现性等技术新特性，以及治理问题的多样性、融合性使得人工智能监管治理面临诸多难题。有效化解人工智能治理安全风险、为人类带来更大的福祉需要各国共同努力，形成更加公正、普惠、包容的全球人工智能治理秩序。中国人工智能治理倡议体现的中华文明创新性、包容性和和平性的独特底色，以及下一步中国基于丰富的人工智能场景实践积累的更加成熟的治理经验，必将为全球人工智能治理实践赋予中国智慧，推动全球人工智能治理体系朝着更加公正合理的方向发展。

（七）谁将在人工智能的竞赛中最终胜出？

在智能愿景逐步聚焦、智能形态日益具身化的共识下，AI竞赛的胜负在两个方面很关键：底座智能涌现能力与制造业整体能力。其一是大模型的智能涌现能力，谁家的大模型智能涌现能力强、幻觉少，同时能耗低，谁就更有技术优势，这方面决定胜负的关键更多在于人才；其二是具身智能体的制造能力，这方面决定胜负的关键是高效能低成本的制造体系。

从目前大模型产业竞争态势来看，谁会率先突破高认知能力的基础模型还有很大的不确定性，而硬件技术和成本将成为决定产品落地的重要因素。比如，人形机器人作为具身智能体的代表性产品，需要多项核心技术的综合集成以实现机器人的感知、规划、行动能力，能够与周边环境进行自然交互并完成各项任务。这就需要依靠基础大模型的认知涌现实现跨场景下的逻辑推理，需要3D多模态感知能力实现与真实世界的交互理解，也需要高性能的软硬件技术实现精准灵巧的运动操作。以中美两国为例，在产业化的第一阶段，中国企业将依靠更完备、更成熟的工业制造体系取得美国企业所不能及的优势。也就是说，能不能“具身”取决于大模型在与物理世界互动过程中能否巩固已经创造的智能和实现新智能涌现能力，而有没有人形功能则取决于设计水平和制造能力，即能否实现高水平的控制、传感、自由度、驱动、连接及材料可靠性等。因此，既不能是“思想上的巨人、行动上的矮子”，也不能“四肢发达、头脑简单”。头脑和本体之间还要整体性、协调性好，协同好了作用才能发挥好。

这就是取胜的两个关键因素。中美两国企业在这两个方面各有优势，底座智能涌现能力关键靠人才，智能体的制造能力关键看制造业水平，这是一个体系能力问题。美国拔尖人才优势非常明显，在高端制造业上也有优势；中国具有完整的产业体系、庞大的市场规模，强大的制造体系和配套生产能力极具优势，中国人才队伍特别是青年科学家和工程师队伍也有一定优势。从最终落地的角度来讲，谁的制造业体系能力强大谁最终胜出的几率就大。能在实体经济领域广泛深化应用的技术才会更有生命力，这也是过去80年来人工智能发展出现几起几落的一个因素。当然，大模型理论和技术在快速发展中，优势劣势也处在快速变化与转化之中，作为后发国家我们要树立信心但绝不能掉以轻心。

在人工智能的竞赛中，不能追求单方胜出，世界共赢才是正道。因为人工智能大国面临着共同问题和责任，就是如何确保人工智能造福世界造福人民，防止出现脱离“智能向善”的轨道。想靠封锁打压、“小院高墙”之类限制一方发展不会有长时效果，在建设人类命运共同体的地球村里，人类探索未知的思想是锁不住的，科学前沿之门决不会只对一家开放。