人工智能天气预报模型相较于传统的物理模型,确实有一些明显优势。但面对气候变暖带来的日益加剧的不稳定性,这类模型仍显得准备不足。

打开网易新闻 查看精彩图片

1970年11月12日,博拉气旋猛烈袭击了当时东巴基斯坦的海岸。风暴的最大持续风速达到每小时205公里,风暴潮高达10.5米,造成约30万至50万人死亡。

直到今天,博拉气旋仍是有记录以来致死人数最多的热带风暴。但如果它发生在十年之后,后果或许不会如此惨重。20世纪70年代,气象学家开始采用基于物理规律的计算机模型,天气预报能力由此发生巨大变化,风暴预测也明显改善。

随着人工智能兴起,天气预报正在经历新一轮演变。但这一次,专家担心,面对前所未有的极端天气,新模型的可靠性可能反而更低。

打开网易新闻 查看精彩图片

研究人员把这称为“灰天鹅”问题。所谓“灰天鹅”天气极端事件,是指在物理上完全可能发生,但因为极其罕见,在训练数据中几乎没有得到充分体现的事件。问题在于,气候变化正在带来更多前所未有的极端天气

例如2021年美国太平洋西北地区热浪。这场事件的强度之高,以至于如果没有气候变化,几乎不可能发生。

物理预报模型可以模拟像太平洋西北地区热浪这样的“灰天鹅”事件,尽管它们会把这类事件标记为极端罕见。这是因为物理模型建立在物理定律之上。相比之下,人工智能模型依赖历史天气数据训练,而在这些数据中,“灰天鹅”几乎不存在。

芝加哥大学地球物理科学副教授佩德拉姆·哈桑扎德赫对媒体表示:“它们在‘灰天鹅’面前会失灵。”他和同事去年4月发表的一项研究,将所有三级至五级飓风从某个人工智能模型的训练数据中剔除,随后再用五级飓风对其进行测试。结果显示,人工智能模型无法准确预测此前从未见过的事件,因为这需要进行外推。

打开网易新闻 查看精彩图片

加利福尼亚大学圣迭戈分校计算机科学与工程副教授罗斯·余在发给媒体的邮件中表示:“真正令人担心的,不是它偶尔预测失误,而是人工智能模型可能会悄无声息地出错:一边自信地给出平平无奇的天气预报,另一边破纪录的极端事件却正在发生。”

她还表示:“其他风险同样不容忽视。人工智能模型可能会以非常细微的方式违反守恒定律,而这些问题未必会在常规指标中暴露出来。一旦预报失败,追查原因也更困难。它们依赖稳定的观测系统,而在当前卫星项目承压的背景下,这一点尤其令人担忧。从制度层面看,如果我们过快转向人工智能,让基于物理的基础设施逐渐萎缩,就会失去目前用于识别人工智能失误的那套冗余机制。”

尽管存在这些隐患,气象界仍在迅速采用人工智能预报模型,原因其实并不难理解。它们更快、更便宜,对计算基础设施的要求也远低于物理模型。在预测常见天气形势和一般天气事件时,也就是不涉及“灰天鹅”的情况下,它们的准确性已可与物理模型相比,而且提升速度很快。

雷丁大学气象学教授、数学、物理与计算科学学院院长安德鲁·查尔顿-佩雷斯对媒体表示:“大多数最先进物理模型的进步速度,通常是每十年把准确预报时效延长一天。听起来不算多,但这其实意义重大。”

打开网易新闻 查看精彩图片

他说:“机器学习模型的准确率提升速度远远超过了这个水平。它们现在已经具备竞争力,而在两三年前,甚至还完全不在一个量级上。”

例如,在2025年大西洋飓风季,谷歌“深层思维”的模型在风暴路径和强度预测上,表现优于几乎所有物理模型。余表示,自2023年以来,图谱播报、盘古天气以及欧洲中期天气预报中心的人工智能预报系统等领先模型,在中期预报指标上,已经能够与最好的物理模型持平,甚至超过后者。

人工智能模型在缺乏传统预报资源的地区尤其显示出价值,而这些地区往往正处在气候变化冲击的前线。哈桑扎德赫曾共同主持一项计划,为印度3800万农民提供基于人工智能的季风预报,使他们最多能提前4周获知雨季开始时间。

哈桑扎德赫解释说:“在天气预报的第一次革命中,很多国家被甩在了后面,因为传统天气预报需要超级计算机、数亿美元投入、跨学科团队、专业劳动力和专家支持。”相比之下,人工智能模型对低收入国家而言更容易获得。

打开网易新闻 查看精彩图片

她在发给媒体的邮件中表示:“要真正理解这些模型的边界、它们可以在哪些方面补充物理模型以及原因何在,仍有大量工作要做。”

纳特说:“不过,我们需要更有组织性,确保能够遵循恰当的程序,并由整个研究共同体建立并持续维护稳健的安全保障。这件事并不容易,因为当下正处于高度追捧阶段,谁都不想错过这股热潮。”

打开网易新闻 查看精彩图片

另一些研究人员,比如哈桑扎德赫,则在探索如何教会人工智能预报模型识别“灰天鹅”。他和同事正在研究,能否把人工智能系统与“相关采样”方法结合起来,通过生成“灰天鹅”事件样本,提升模型对前所未有极端事件的外推能力。

理解并解决人工智能天气预报局限性的努力将至关重要,因为这条路已经无法回头。人工智能正在重塑天气预报的方式,而随着气候变得愈发不稳定,气象学家需要手中每一种工具都足够锋利、足够可靠。

尽管这些系统目前仍有局限,继续推动其发展,并探索如何将其与物理预报更好结合,仍然大有可为。

余表示:“当前的研究议程,是让人工智能模型在物理上保持一致、校准充分,并能在数据分布发生变化时保持稳健。如果因为‘灰天鹅’问题就放弃这一路径,等于放弃了这一代天气预报技术中最大的一次提升。”