打开网易新闻 查看精彩图片

导语

空气污染预测是一个经典的复杂系统问题——污染物的积累与消散受到排放源、气象条件、大气化学反应等多重因素的交织影响,呈现出高度非线性的时空演化特征。传统物理化学模式虽能模拟这些过程,却面临计算成本高、极端事件偏差大等瓶颈。能否借助深度学习技术,在保持预测精度的同时大幅提升计算效率?更进一步,当我们将预测视野延伸至未来数十年,空气质量会如何演变?答案或许并不像“减排即改善”那样简单。

本文解读这篇2026年2月发表于 Urban Climate 的最新研究。研究团队开发了一种集成图神经网络(IGNN)模型,系统预测了2025-2050年华北城市群的PM₂.₅和O₃浓度变化趋势,揭示了一个值得关注的现象:在多种未来情景下,PM₂.₅显著下降,而O₃却呈现上升态势。这一“跷跷板”效应背后的物理化学机制,为我们理解大气系统的复杂性提供了新的视角。

关键词:图神经网络、空气质量预测、PM₂.₅、臭氧、时空建模、深度学习

张钢锋、王硕丨作者

赵思怡丨审校

打开网易新闻 查看精彩图片

论文题目:A deep learning approach predicts O₃ increase and PM₂.₅ declines under high emission scenario across the Northern China urban agglomeration 论文链接:https://doi.org/10.1016/j.uclim.2025.102752 发表时间:2026年2月 论文来源:Urban Climate

作者简介

1. 研究背景:复杂系统视角下的空气质量预测

空气污染的形成与演变是一个典型的复杂系统问题。以华北城市群为例,该区域涵盖28个城市(“2+26”大气污染传输通道城市),呈现出显著的季节性污染特征:冬季弱风少雨,细颗粒物(PM₂.₅)容易积累;夏季高温强辐射,氮氧化物和挥发性有机物发生光化学反应,生成近地面臭氧(O₃)。这两种污染物的形成机制截然不同,却又通过大气化学过程相互耦合,构成了一个多变量、非线性、时空交织的动力学系统。

准确预测这样一个系统的演化,面临多重挑战。传统方法大致分为两类:一是基于物理化学机制的数值模式(如CMAQ、WRF-Chem),能够显式模拟大气化学过程,但计算成本高昂,且对输入数据和参数化方案高度敏感;二是数据驱动的机器学习方法,计算效率高,但传统模型在处理具有网络结构的时空数据时能力有限。

近年来兴起的图神经网络(Graph Neural Network, GNN)为解决这一问题提供了新思路。GNN的核心优势在于,它能够在图结构上进行信息传递和聚合,天然适合建模城市群中污染物传输的网络化特征。本研究正是基于这一思路,将空气质量预测问题转化为图结构上的时空建模任务。

2. 方法创新:将城市群建模为“图”

2.1 图结构的构建

研究团队提出的集成图神经网络(Integrated Graph Neural Network, IGNN)模型,核心设计理念是将华北城市群的28个监测城市构建为一个图(Graph):城市作为节点(nodes),城市间的空间关联作为边(edges),而气象要素(温度、风速、辐射、湿度等)、排放数据(PM₂.₅、NOx、VOCs等)和历史观测则作为节点与边的属性特征。

这种图结构的设计契合了污染物传输的物理本质——一个城市的空气质量不仅取决于本地排放和气象条件,还受到周边城市的显著影响。通过图结构,模型能够显式地建模这种城市间的“信息传递”过程。

打开网易新闻 查看精彩图片

图1:IGNN模型架构框架图

2.2 时空特征的融合

模型架构包含三个核心模块:

谱图卷积模块:通过图拉普拉斯变换实现相邻城市信息的高效聚合。模型能够自适应地学习城市间的污染物传输关系——既包括基于地理距离的静态空间知识(如200公里阈值),也包括由风场驱动的动态传输路径。这一设计类似于在图上进行“消息传递”,让每个节点能够“感知”其邻域的状态。

时间卷积模块:采用膨胀卷积(dilated convolution)提取气象和排放数据的时序特征。膨胀卷积通过引入空洞因子扩大感受野,能够在不增加参数量的情况下捕捉更长时间尺度的依赖关系,对应真实场景中污染气体的生成与传输过程。

双通道并行处理:使用两个相同的时间卷积模块分别建模污染物的积累与扩散,通过残差连接保证梯度稳定传播。

2.3 避免误差累积的设计

与传统序列到序列的预测方法不同,IGNN采用“一对一映射”策略——直接基于当前时刻的气象和排放信息输出预测结果,而非逐步累积至目标时刻。这一设计有效避免了长期预测中的误差累积问题,对于延伸至2050年的长期预测尤为重要。最终模型参数量仅为119KB,训练时间不超过3小时,展现出良好的计算效率。

3、模型验证:历史数据与极端事件测试

研究团队使用2014-2020年的历史数据对IGNN进行了系统验证,并与多种主流方法进行对比,包括XGBoost、LightGBM、STGCN等机器学习方法,以及CMAQ、WRF-Chem等物理化学模式。

打开网易新闻 查看精彩图片

图2:2019年北京PM₂.₅和O₃观测值与IGNN预测值的散点图

整体而言,IGNN在PM₂.₅和O₃预测的主要评估指标上均取得最优表现。值得注意的是,所有方法对O₃的预测效果普遍优于PM₂.₅,这反映了O₃浓度具有更强的日周期规律性,而PM₂.₅的变化则受到更多随机因素的影响。

为进一步检验模型对极端天气的适应性,研究选取了2019年1月北京PM₂.₅重污染事件和7月O₃重污染事件作为典型案例,将IGNN与CMAQ、WRF-Chem两种物理化学数值模式进行对比。

打开网易新闻 查看精彩图片

图3:2019年重污染事件期间观测值与三种模型预测值的时间序列对比

从时间序列可以直观看出,IGNN(红线)能够较好地跟踪观测值(蓝线)的波动节律,尤其是峰值的出现时刻和幅度。相比之下,CMAQ(绿线)和WRF-Chem(黄线)在污染物浓度快速变化的时段出现明显偏离。

这种差异源于两类方法的本质不同。CMAQ和WRF-Chem作为机理驱动的数值模式,需显式求解大气化学和气象动力学方程,其预测质量高度依赖于边界条件设定、排放清单分辨率及参数化方案选择,在极端事件中这些不确定性会被放大。而IGNN作为数据驱动方法,直接从历史观测中学习非线性映射关系,能够隐式捕捉那些难以显式表达的复杂相互作用。

当然,数值模式在机理解释和过程诊断方面具有不可替代的优势。本研究表明,在以预测精度为首要目标的应用场景中,数据驱动方法展现出显著的性能优势和计算效率提升。这些验证结果为IGNN应用于长期预测奠定了方法学基础。

4. 未来预测:PM₂.₅与O₃的“跷跷板

4.1 差异化的变化趋势

利用验证后的IGNN模型,研究团队结合CMIP6气候情景和多种排放策略,对2025-2050年华北城市群的空气质量进行了系统预测。

打开网易新闻 查看精彩图片

图4:不同排放策略下2025-2050年PM₂.₅和O₃年均浓度变化趋势

预测结果揭示了一个核心发现:在多种情景下,PM₂.₅呈现下降趋势,而O₃却呈现上升趋势。这种“跷跷板”效应在不同排放策略下普遍存在,且减排力度越大的策略,这种差异化趋势越明显。

PM₂.₅的下降符合直觉——它直接反映了排放控制的效果。然而,O₃的上升则揭示了大气化学系统的复杂性:减少一种污染物,并不必然导致另一种污染物同步改善。

4.2 机制解释:三重效应的叠加

这一看似矛盾的结果,可以从三个相互关联的物理化学机制来理解:

辐射效应:PM₂.₅是大气气溶胶的重要组成部分,对太阳短波辐射具有散射和吸收作用。PM₂.₅浓度下降使到达地表的短波辐射增强,而辐射正是驱动O₃光化学生成的核心能量来源。

自由基清除效应:PM₂.₅颗粒物表面可作为多相化学反应的载体,能够清除HO₂和NOx等O₃前体物。PM₂.₅浓度降低削弱了这种“汇”效应,使更多前体物参与光化学循环,最终转化为O₃。

气候变化效应:在高碳排放情景下,全球升温加速光化学反应速率,进一步促进O₃生成。

三重效应的叠加,解释了为何PM₂.₅与O₃呈现差异化的变化趋势,也揭示了大气污染系统中存在的复杂非线性耦合关系。

4.3 重污染天数的演变

打开网易新闻 查看精彩图片

图5:不同情景下PM₂.₅和O₃重污染天数变化趋势

重污染天数的分析进一步印证了上述发现:PM₂.₅重污染天数呈下降趋势,部分情景下甚至有望完全消除;而O₃重污染天数在多数情景下呈上升趋势。这种差异化的演变模式,提示我们在理解和预测空气质量变化时,需要充分考虑不同污染物之间的相互作用机制。

5. 科学启示与研究展望

5.1 复杂系统视角的价值

本研究的核心发现——PM₂.₅与O₃的差异化变化趋势——为我们理解大气污染的复杂性提供了一个生动案例。它表明,大气化学系统并非简单的线性叠加,而是存在多重反馈和耦合机制。这种复杂性意味着,“减排即改善”的线性思维在某些情况下可能过于简化。

从更广泛的复杂系统视角来看,这一发现也呼应了复杂系统研究中的一个核心主题:涌现性(emergence)。系统的整体行为不能简单地从各部分的行为推断,组分之间的相互作用可能产生意想不到的宏观效应。

5.2 图神经网络的方法学潜力

从方法学角度,本研究展示了图神经网络在环境科学领域的应用潜力。通过将地理空间上分布的监测站点建模为图结构,模型能够有效捕捉污染物传输的网络化特征。这一思路具有良好的可推广性,可应用于其他具有类似空间结构的环境预测问题。

5.3 局限与未来方向

研究团队也指出了若干局限性。当前模型中风向的标量编码方式可能引入一定偏差,未来可采用正余弦分解等方法更严谨地处理周期性变量。此外,作为数据驱动方法,IGNN在物理机制解释性方面存在固有局限。

未来研究的一个重要方向是探索物理引导的神经网络(physics-guided neural networks),将深度学习的拟合能力与大气物理的机制约束相结合,以兼顾预测精度与可解释性。

结语

本研究为空气质量预测提供了一种基于图神经网络的新方法,并通过长期预测揭示了PM₂.₅与O₃在未来情景下的差异化演变趋势。这一发现不仅具有科学意义——它深化了我们对大气化学系统复杂性的认识,也具有方法学价值——它展示了深度学习技术在环境科学中的应用前景。

正如复杂系统研究所揭示的,理解一个系统的行为,往往需要超越对单一组分的分析,转向对组分间相互作用的把握。大气污染系统亦是如此:PM₂.₅与O₃之间的非线性耦合,正是这种复杂性的具体体现。

论文信息

Zhang G, Wang S, et al. A deep learning approach predicts O₃ increase and PM₂.₅ declines under high emission scenario across the Northern China urban agglomeration. *Urban Climate*, 2026, 65: 102752.

DOI: https://doi.org/10.1016/j.uclim.2025.102752

地球系统科学读书会

世界气象组织《2023年全球气候状况》报告确认2023年是有观测记录以来最暖的一年。气候变化正在以高温、干旱、洪水、野火和沙尘暴等极端天气的形式吸引人们的广泛关注。世界经济论坛《2024全球风险报告》将气候变化作为首要值得关注的风险。地球作为一个多要素、非线性的开放复杂系统,要素间相互作用关系复杂,往往牵一发而动全身。在人类活动深刻影响下,我们该如何理解并有效应对正在面临的气候变化以及其带来的社会经济等一系列议题,实现人类与地球的可持续发展?

为了能够深入理解人类世背景下地球系统各要素之间复杂的相互作用与演化机制,并为人类应对未来的地球系统科学重大挑战提供一套科学的认知框架,集智俱乐部联合清华大学讲席教授陈德亮、北京师范大学教授樊京芳、东莞理工学院特聘副研究员陈爱芳、南开大学副教授戴启立老师和爱尔兰都柏林大学博士生班崭共同发起,将组织大家从新的研究范式出发梳理相关文献,并深入研读其中涉及的理论与模型。


详情请见:

1.

2.

3.

4.

5.

6.

7.