那个下午,我第一次看清野火疏散物流的复杂度有多离谱。当时我在分析2020年加州野火的卫星影像,烟雾跨县蔓延,我盯着屏幕想:靠静态数据集训练的集中式机器学习模型,面对这种动态、分布、争分夺秒的疏散场景,底子就是薄弱的。每一场火都不同,每个社区基础设施千差万别,响应窗口论分钟计——传统那套根本转不动。

这事儿开始得挺偶然。博士期间我做边缘计算的联邦学习研究,正捣鼓稀疏表示学习来降低物联网网络的通信开销,一位搞灾害管理的同事找上门:“你的模型能不能实时算最优疏散路线?前提是不依赖中心服务器——那玩意儿可能在火里先挂了。”一句话把我拽进这个坑,一干两年。后来我给这套东西起了个名:稀疏联邦表示学习,专门怼野火疏散物流网络,还加了具身智能体的反馈闭环。下面说的不是纸上谈兵,我真在模拟野火场景里跑过,用的真实路网数据、多智能体强化学习环境,踩过坑也摸到了门道。

打开网易新闻 查看精彩图片

传统疏散规划的老路子就是集中式模型,把所有传感器、交通摄像头、气象站的数据往一个中心灌。可野火一来,通信设施先被干穿,数据延迟让预测直接作废,位置数据涉敏没法共享,历史数据训出来的模型碰到前所未见的火情直接抓瞎。我亲手试过——早期实验我在中心服务器部署了一个深度学习模型预测疏散时间,模拟一把火切掉服务器的数据中心,整个系统秒崩。那一下我明白了,得走分布式、抗毁的路子。

联邦学习的思路是让多个节点——地方应急指挥中心、自动驾驶车辆、物联网传感器——协同训一个共享模型,原始数据不挪窝。稀疏表示学习往上加了一层关键操作:每个节点不传完整模型更新,而是学出本地数据的压缩稀疏表示,比如疏散瓶颈、道路阻断、人口密度这些特征,只挑最有信息量的那部分共享。这一刀直接把通信带宽砍掉最高九成。我的实验里出现了几个反直觉的发现:稀疏编码本身就有点抗噪,节点不用频繁通话也能维持可用的疏散路线推荐精度。一旦通信间歇性断掉,这套机制比全量更新的模型能多撑好几个小时。