美国人工智能驱动的科学研究新进展和部署动向——以美国能源部为例|人工智能|科学|美国能源部|计算机视觉

一、研究背景

近10年来，自监督学习、几何深度学习和生成式人工智能等技术快速发展。与此同时，人工智能与不断发展的算力和大数据技术相结合，深度学习迅速成为计算机视觉、自然语言处理等领域的主导方法。

在上述进步推动下，人工智能逐渐展示出改进、加速和促进人们理解自然现象的能力，不断推动科学的研究发展。研究人员开始使用人工智能工具提出假设、设计实验、收集和解释大型数据集，由此形成AI4S这一前沿领域。1998年获得图灵奖的詹姆斯·尼古拉·格雷（James Nicholas Gray）将大数据主导的科学知识生产方式称为科学的“第四范式”。人工智能已经在生物医药、数学、物理、化学、材料和海洋环境气象等多个领域带来新的发现、取得突破性进展，在高通量实验室的设计和优化中，人工智能为探测物质、从细节中理解复杂的自然现象等提供新的解决思路。

生物医药。生物医药是AI4S最热门的领域之一，人工智能工具已开始应用于药物发现、精准医疗、辅助诊断、基因编辑和放射成像等诸多子领域。最著名的应用是谷歌DeepMind于2020年开发的AlphaFold 2，彻底改变了传统的蛋白质结构预测方法，截至2022年7月，AlphaFold蛋白质结构数据库已拓展到超过2亿个蛋白质结构，几乎涵盖了DNA数据库中已知生物的所有蛋白质。2023年9月，谷歌DeepMind发布用于蛋白质错义突变的模型AlphaMissense，引发各界高度关注。2024年5月，谷歌DeepMind及其同构实验室——Isomorphic Labs发布AlphaFold 3，再次大幅提升该模型性能。在医疗领域，谷歌公司陆续推出医疗大模型Med-PaLM2、MedGemini，后者为多模态医疗大模型，与其他模型相比，该模型在语言理解和处理不同类型数据、信息方面更为出色；微软于2023年推出了用于生物医学领域的大型语言和视觉模型LLaVA-Med，可以根据开放性指令辅助回答关于生物医学图像的问题。

数学。2017年以来，数学家尝试使用人工智能求解偏微分方程，获得更快、更准确的结果。2021年，悉尼大学研究人员使用DeepMind开发的人工智能流程证明了Kazhdan-Lusztig多项式的成立。2022年10月，DeepMind推出矩阵乘法算法应用AlphaTensor，通过强化学习找到矩阵相乘的最快算法。2023年6月，DeepMind推出AlphaDev，用于发现更高效的排序算法。2014年1月，DeepMind和纽约大学合作开发AlphaGeometry，够解答以往国际数学奥林匹克竞赛（IMO）中30道几何题中的25道，成功率与人类金牌得主相当。

物理。高能物理和核物理学界于20世纪90年代已开始使用人工智能辅助研究。在高能物理、天文物理和凝聚态物理等领域广泛应用，研究人员使用人工智能处理大量异构数据以加速科学发现。2014年，人工智能神经网络赢得ATLAS实验中识别希格斯玻色子挑战。2022年，DeepMind通过深度强化学习对托卡马克等离子体进行磁控。2022年8月，物理学家使用神经网络找到质子中存在隐性内含粲夸克的证据等。

材料。此前，人工智能技术在材料科学领域一直处于探索期，应用主要集中在宏观尺度的代理模型，如计算机模拟代替风洞实验，解决实验成本过高的问题。近年来，研究人员开始探索使用人工智能研究原子尺度、微观和连续尺度的问题，用于发现分子结构和材料属性间的映射关系、进行分子动力学模拟等。2023年11月，DeepMind推出生成式人工智能材料模型GNoME，利用其预测了220万种晶体材料，其中38万种是稳定的；DeepMind还与劳伦斯伯克利的A-Lab项目合作，展示自动化实验室进行自主材料合成。

海洋、气象、气候变化、环境监测等。在气象学、大气科学、水文学、气候科学和海洋科学等学科领域，研究人员开始尝试使用人工智能建模，用于提高天气预报准确性，预测海平面上升、气候变化、极端天气或自然灾害等。例如，英伟达公司开发的开源框架——“Modulus物理-机器学习模型”，在同精度级别下获得3～5个数量级的加速效果。2023年11月、2024年3月，谷歌公司陆续推出人工智能天气预报模型、自然灾害模型等；2024年6月，微软公司推出首个大气人工智能基础模型Aurora，能够准确预测全球天气和空气污染。

二、重点领域、发展方向及挑战

相比传统科学研究，人工智能在驱动科学研究、辅助科学发现等方面具备一些突出优势。

（1）深度神经网络能够有效表达或逼近高维空间函数，有利于克服传统多项式计算的“维度灾难”问题，适合处理维度高、跨度长、需要大量计算的问题；（2）端到端学习的“黑盒”属性，由输入直接生成输出，有望从海量数据中直接总结规律，避免计算过程中人工输入特征的需要；（3）大语言模型（LLM）快速发展，进一步推动人工智能融入科学研究工作流程当中。

美国联邦政府部门中，美国能源部（DOE）、国家科学基金会（NSF）是AI4S最主要的推动力量，美国国家航空航天局、国家海洋和大气局等科研管理部门也参与其中。上述科技管理部门中，美国DOE拥有实力雄厚的科研基地，建设了多个超算中心，管理28个国家用户设施（User Facilities），其下属国家实验室长期关注AI4S前沿领域。在2020年和2023年，美国DOE先后发布两份综合性技术报告，为AI4S、人工驱动的能源等领域建立初步愿景和确立新范式发展方向。

2.1 人工智能代理模型

人工智能代理模型（Surrogate Models）是设计中一种常用的近似模型。在工程设计、实验或计算量较大的科学研究（如计算流体动力学、等离子体物理、粒子传输、多物理场模拟等）中，往往需要根据传统仿真模型生成的数据训练人工智能代理模型，达到降低计算复杂度，从而加速模拟的目的。

人工智能代理模型以“黑盒”模型为主，已广泛应用于多孔介质模拟、核密度泛函理论、宇宙学、可压缩湍流模型和气候科学等研究中。但“黑盒”模型的模拟结果高度依赖训练数据，缺少物理约束，此外由于模型特性，导致建模失败后难以开展原因分析并采取相应的纠正和优化措施。

美国DOE认为，在现有技术的基础上，结合DOE长期积累的建模和算力基础，有望推动更通用、更先进、更自主化的下一代人工智能代理模型发展。主要包括以下3个重要方向：

一是构建功能强大的人工智能代理模型。将复杂的图像、图形、自然语言和网络数据等高度异构的数据有效整合到技术工作流程当中，同时探索“传统模型+代理模型”的混合模型网络，相互取长补短，提高科学研究的自动化程度。

二是发展可信人工智能代理模型。针对现有人工智能代理模型存在分布式泛化、不确定性量化困难和鲁棒性不足等挑战，可以通过在训练数据集中集成或构建物理学基本关系，为模型建立物理约束边界，这种在模型中提高可信度的方式对科学仪器、自动驾驶等领域尤为重要。

三是以可扩展、可持续的方式训练代理模型。通过构建跨平台的软件框架，进一步在大型科学研究活动中更广泛地使用人工智能代理模型。

针对上述方向，美国DOE建议推动大型试点项目：（1）高保真亚尺度建模和实验训练数据集学习的等离子体湍流聚变的机器学习闭包（Closures）；（2）对于地球系统模型中的海洋模型，开发可加速数值模拟（Spin-up）的代理模型；（3）发现连接环境强迫（高光谱数据）与生物反应（组学数据）的生物学机制；（4）大规模宇宙学的生成式人工智能代理模型。

2.2 用于科学发现的人工智能基础模型

现阶段，人工智能的训练效果与数据集的规模、质量密切相关。当前，众多学科领域存在数据来源、形式、结构较为分散的问题，仅有少量数据集严格经过人工标注，难以在更通用的领域发挥功能。

展望未来，美国DOE希望推动使用大量不同来源、未经人工标注的、异构的数据训练一批广泛适用的人工智能基础模型。学界和部分企业已开始在计算机视觉、蛋白质结构预测、有机分子、生物文献挖掘和DNA序列分析等领域探索构建基础模型。预计上述基础模型的参数量将达到千亿甚至万亿级别，训练数据集规模在千兆字节或太字节水平。

开发的科学基础模型有望在材料设计、气候变化、医疗、粮食生产和电力分配等一系列综合、复杂问题中发挥重要作用。主要包括两个重点方向：

一是针对上述材料设计、生物医药、气候变化和能源等若干关键科技领域，打造一系列大型基础模型。

二是在各学科基础大模型的基础上，探索多个基础模型和传统学科建模相结合的综合人工智能系统。

围绕上述方向，美国DOE建议重点打造多个大型基础模型：（1）用于生成复杂分子化合物、聚合物、晶体、蛋白质的分子设计基础模型；（2）获取世界各地医疗保健数据，整合开发癌症质量基础模型；（3）国家安全基础模型；（4）开发低延迟、高带宽的基础模型，实现基础模型与传统建模相衔接、相融合的综合人工智能系统。

2.3 高级属性推断和逆向设计

高级属性推断和逆向设计是科技领域一个较新的研究方向。与普遍采用知识驱动的正向设计不同，在逆向设计中，设计人员规定目标属性，系统根据目标进行高维推理，在高维参数空间中寻找最佳解决方案。研究人员正尝试开发逆向设计方法，探索在蛋白质折叠、材料、化学和高能物理等领域进行应用。

面向科学发现和复杂工程设计的高维属性推理和逆向设计尚处于初步探索阶段，为达到在复杂、多尺度系统的设计和运行中快速探索高维参数空间的目的，要求人工智能模型具备广泛而准确的推理能力。现阶段还存在一系列重大挑战，例如，以高精度和可量化的不确定性进行推理；在有限数据或海量异构数据的条件下进行训练；跨空间和时间尺度构建物理约束；可说明、可解释、可信的推理；在复杂的设计空间中进行逆向设计。

为克服上述挑战，需要在多个交叉领域中对数学方法、算法等进行大量探索，同时为大型交叉学科团队提供获取、整理和管理数据的基础设施，同时探索和开发新的软硬件平台。

针对上述挑战，美国DOE建议实施试点项目：（1）生物化学、化学和材料的推理设计、工程和可制造系统的自动设计和优化；（2）人工智能用于能源韧性基础设施；（3）具有韧性的水资源和农业资源。

2.4 基于人工智能的复杂系统设计、预测和控制

美国DOE定义或关注的复杂系统主要包括：电网、交运网络、供应链等关键基础设施；自动驾驶、大型计算网络、核能（裂变、聚变）、大型科学装置（如光源设施、加速器等）、先进制造和先进涡轮发动机等。此外，生物系统在很多方面表现出与复杂系统相似的特性，在开发相关人工智能系统中面临类似的挑战。

基于人工智能的复杂系统设计、预测和控制首先需要建立“数字孪生”（Digital Twin）系统，即使用人工智能对实体系统进行数字建模，该模型能够及时响应或预测系统状态，达到更好控制、预测和维护系统的目的。

对于复杂系统，系统依赖各部件之间的非线性相互作用，即使能够针对各部件进行单独建模，也难以反映各部件之间复杂的非线性相互作用，因此难以实现人工智能代理模型、基础模型、逆向设计类似的“端到端”建模。

复杂系统中实现数字孪生技术还面临诸多挑战，包括：（1）不确定性量化、验证、鲁棒性、可解释性和可分析性、异常检测等质量保证相关的要素；（2）基于实体系统及运行环境构建并及时更新模型；（3）搭建基于人工智能的控制系统；（4）能够进行“数字孪生”交互的软硬件架构、系统及工作流程；（5）数据质量、可用性及数据管理；（6）标准化，以及确定系统开发相关的指标。

针对上述问题，美国DOE提出以下试点项目，包括：优化电网控制、基于人工智能的大型计算中心和（或）科学仪器控制、交通运输系统建模、托卡马克装置的反应堆控制以及涡轮发动机早期故障诊断。

2.5 自主发现的人工智能和机器人

结合人工智能和自动化技术，旨在开发“机器人科学家”，使得系统能够自动从实验和模拟数据中推断复杂规律，并自主进行新的实验设计，达到持续迭代、自主发现的目标。

现阶段，先进的科学仪器不断提升科学家的观察能力，但与此同时，科学家越来越依赖自动化技术辅助、加速科学发现。距离实现可自主发现的人工智能和机器人还面临几个重要挑战，包括开发机器人科学家、建立用于科学发现的高通量自动化设施以及能够智能集成的互联科学装置。

为实现上述目标，美国DOE建议开展两项试点项目，包括：（1）推动区域、洲际、全球尺度监测系统倡议，借鉴边缘网络概念，使用分布式人工智能系统进行数据分析，最终为自然和环境提供实时决策支撑；（2）用于关键矿物提取的聚合物设计，推动有效提取、浓缩和回收关键矿物。

2.6 人工智能编程和软件工程

GPT、Codex等商业人工智能工具已经展示了从自然语言生成代码的可能性。在科学研究领域，开发用于编程的人工智能工具能够极大地促进软件开发和维护、优化、架构设计等工作流程，将程序员的效率提升10倍以上。

针对先进计算、复杂系统的控制和自动化、跨集群科学研究等领域，开发人工智能编程和软件助手也面临一系列重大挑战：一是用于复杂系统的控制软件，要求该软件具备逻辑自洽、鲁棒性、互操作性和快速适应能力，目前在技术上还难以实现；二是科学和工程领域的专业性和复杂性决定了该领域对软件质量要求非常严苛，程序需满足保真度、不确定性量化、验证和确认等一系列要求；三是用于高性能计算机的编程和架构，对异构架构的需求快速增长，为适应这一趋势，需要进一步探索人工智能辅助软件开发和新的硬件架构。

三、美国DOE部署情况‍‍‍‍‍‍‍‍‍

自曼哈顿计划时期，美国原子能委员会（1974年与美国能源研究开发署合并成立DOE）即开始持续支持数字计算项目，至今美国DOE及下属国家实验室在先进计算机科学领域研发已超过70年。美国DOE科学办公室的高级科学计算研究（ACSR）项目长期支持计算科学和应用数学研究，探索新型计算和网络基础设施等前沿领域发展。截至2024年5月，美国DOE在AI4S领域的部署主要是依托其下属实验室的超级计算机和大型科研设置开展，旨在打造以高性能计算（HPC）为核心的人工智能生态，解决科学研究、能源和安全等领域的关键问题。展望未来人工智能驱动科学、能源等领域发展，美国DOE进一步提出探索“多个HPC+边缘计算”的超大型人工智能计算网络，整合不同来源、不同学科、高度异构的海量科学和工程数据，打造科学、工程基础人工智能模型的构想。为此，美国DOE正从组织机构、基础设施和前沿项目等领域进行一系列部署。

3.1 成立关键和新兴技术办公室

2023年10月，美国颁布总统行政令EO14110“安全、可靠和可信地开发和使用人工智能”，其中要求美国DOE达成以下目标：（1）开发用于构建人工智能驱动科学的基础模型的工具；（2）促进和开发用于缓解气候变化风险的人工智能工具；（3）扩大合作伙伴关系，为科学、能源和安全等领域构建人工智能基础模型。

2023年12月，美国DOE在总统行政令要求的基础上，进一步拓展任务领域，成立关键和新兴技术办公室（CET），主要涉及人工智能、生物技术、量子信息科学和微电子等领域。人工智能方面，CET负责统筹推进美国DOE人工智能创新生态系统建设，加强人工智能劳动力培养，CET主任被任命为美国DOE首席人工智能官（CAIO）。 CET主要负责：（1）推动关键和新兴技术领域研发，解决科学、能源和安全等领域面临的重大挑战；（2）协调美国DOE及下属17个国家实验室的关键和新兴技术研发部署；（3）与产业界、学界合作推动技术突破，加速技术与商业融合，确保研发、示范和创新处于最前沿。

3.2 打造面向基础人工智能模型的基础设施

推进百亿亿次计算项目（Exascale Computing Project，ECP）。2016—2023年，美国DOE启动为期7年、总投入约18亿美元的ECP，旨在调动硬件、软件和应用程序集成等工作，推动百亿亿次HPC发展，该项目核心实验室包括阿贡、劳伦斯利弗莫尔、橡树岭、洛斯阿拉莫斯和桑迪亚等5个国家实验室。在EPC推动下，橡树岭、阿贡国家实验室陆续建成前沿（Frontier）、极光（Aurora）超级计算机，劳伦斯利弗莫尔国家实验室的酋长岩（El Captain）超级计算机正在建设，预计算力将超过200亿亿次浮点运算。此外，洛斯阿拉莫斯国家实验室使用自有预算，建成了专门面向人工智能的Venado超级计算机，算力达到10亿亿次浮点运算。

展望下一代科学计算网络。在ECP推进的同时，美国继续布局下一代研发基础设施，美国白宫国家科技委员会（NSTC）于2021年10月、2022年5月分别发布《研发基础设施国家战略概述》《未来先进计算生态战略计划实施路线图》等指导性文件。美国DOE于2023年正式推出“综合研究基础设施”（Integrated Research Infrastructure，IRI）计划，包括一系列框架、战略设想和工作流程。IRI将在3个维度上搭建综合的科学研究基础设施：一是打造“本地先进计算、计算测试台、云计算、边缘传感器”组成的专用计算网络，有效连接观测、国家用户设施、先进计算等研究资源；二是为使用多个国家用户设施的用户打造新型工作流程，包括一系列软件、应用、人工智能工具和数字孪生等；三是通过访问高性能数据设施和数据集，实现数据快速分析。

深度参与国家人工智能研究平台（NAIRR）。在前期立法、总统行政令的推动下，美国国家科学基金会经多年酝酿，正式推出面向中小型研究机构的国家人工智能研究平台，于2024年1月开始试点，共包括开放、安全、软件和教学4个模块，美国DOE作为主要支持部门，深度参与NAIRR试点：一是与国立卫生研究院共同领导NAIRR安全模块；二是延长橡树岭国家实验室顶点（Summit）超级计算机的服役年限；三是开放阿贡国家实验室的人工智能测试平台；四是与NSF共同宣布NAIRR首批35个试点项目。

3.3 在不同的垂直领域推进一系列研究项目

在前期探索的基础上，美国DOE围绕先进计算基础设施，陆续在气象、地球观测、核能和科学发现等领域布局150余个项目，其中包括若干人工智能基础模型和科学数据项目：

综合类。包括阿贡国家实验室的AuroraGPT，橡树岭国家实验室的FORGE，太平洋西北国家实验室的可扩展人工智能，布鲁克海文国家实验室的多模态科学数据等面向科学和能源的基础大模型和多模态数据项目。

气象、地球观测类。包括桑迪亚国家实验室的能源百亿亿次国家系统模型（E3SM），橡树岭国家实验室的多尺度地球观测基础模型，阿贡国家实验室的Stormer天气预报基础模型和WildfireGPT山火分析大模型等。

核能类。包括阿贡国家实验室的先进反应堆创新的安全自动化（SAFARI）、反应堆先进控制，橡树岭国家实验室的核不扩散基础模型等。

科学发现类。包括布鲁克海文国家实验室的大型蛋白质结构集成机器学习（IMPRESS）、洛斯阿拉莫斯国家实验室的基础生物模型、劳伦斯伯克利国家实验室的人工智能数学方法、劳伦斯利弗莫尔国家实验室的生成式无约束药物工程（GUIDE）、橡树岭国家实验室的材料多尺度模拟基础替代模型、SLAC国家加速器实验室的高能物理基础模型等。

2024年5月，美国DOE推出面向下一代人工智能基础模型、计算机网络和科学数据的科学、安全和技术人工智能前沿“FASST”计划。

四、启示

AI4S是新兴且快速发展的研究领域，已在多个领域展示出加速科学发现、解决复杂工程问题的重要潜力。现阶段，人工智能技术还普遍存在可解释性、可靠性、不确定性量化、分布式泛化等诸多技术挑战，影响AI4S进一步发展。

美国DOE及下属17个国家实验室拥有一大批大型科学设施，运营并维护世界领先的高性能计算机和科学数据库，长期资助科学研究和工程建设，在AI4S领域具有得天独厚的资源、人才和知识基础。在前期积极部署人工智能基础设施建设的同时，美国DOE面向未来，积极探索AI4S前沿方向，重点在整合现有资源，充分发掘自身算力和数据潜力，开发一系列通用、可扩展、高自主性的人工智能平台、基础模型和工具，在该领域建立并保持领先地位。美国DOE的重点研发领域和发展方向对中国部署AI4S具有一定的借鉴意义：

一是前瞻性部署支持该领域的先进基础设施建设。在展望AI4S之初，就积极配合《研发基础设施国家战略概述》《未来先进计算生态战略计划实施蓝图》等战略，推出百亿亿次计算项目，着力围绕先进计算打造人工智能生态系统。

二是聚焦AI4S挑战。推动人工智能模型自主学习、调整和优化，在科学知识整合、异构大数据、有限小数据等不同领域提升模型的集成和泛化能力，同时满足可解释、软件验证及确认、不确定性量化、鲁棒性等科学和工程使用要求。

三是面向大型人工智能平台和基础模型。探讨多个超级计算机、边缘传感器和云计算组成的超级计算网络，提出研究更先进的软、硬件架构，探索将人工智能引入科研工作流程，不断提高科学研究的自主化水平。同时，进一步整合优化庞大、分散和繁杂的研究数据资源，形成统一的科学数据平台，为开发高质量人工智能基础模型、促进科学发现和解决复杂的工程问题提供更好的支撑。

作者：王兆然，中国生态环境部

本文转载自微信公众号科情智库，原载于《全球科技经济瞭望》2024年第6期

投稿邮箱： nais-research@cnais.org.cn