太空里的AI又往前迈了一步。澳大利亚阿德莱德大学和SmartSat合作研究中心的研究团队,把NASA与IBM联合开发的开源模型Prithvi送上了两颗在轨卫星——一颗是南澳政府的Kanyini卫星,另一颗是国际空间站上的Thales Alenia Space IMAGIN-e载荷。这是地理空间AI基础模型首次在太空部署运行。

Prithvi的训练数据覆盖了13年的卫星影像。研究团队上传的是压缩版本,测试重点是洪水检测和云层识别两项任务。选择这个模型,团队看中的不是单一功能,而是它在各类地球观测任务中的泛化能力,以及最关键的一点:开源。

打开网易新闻 查看精彩图片

"如果Prithvi不是开源的,我就得自己从头训练一个基础模型,"项目负责人Andrew Du博士说。他是阿德莱德大学博士后,同时在SmartSat担任AI工程师。"开源省下了大量时间和精力。"

基础模型的逻辑在于先用海量无标注数据训练出"通识",再用少量标注数据微调具体任务。Prithvi基于NASA的Landsat和欧空局Sentinel-2卫星数据训练,数据源是Harmonized Landsat and Sentinel-2数据集,积累了超过十年的全球地理空间信息。下游应用包括绘制洪泛区、灾害监测、作物产量预测等。

NASA总部首席科学数据官Kevin Murphy的表态很直接:"Prithvi是第一个在轨部署的同类模型,这恰恰说明了我们为什么要开源。把工具开放给所有想用的人,就是在加速未来的科技发展和科学进步。"

这次验证的特殊之处在于"双平台"——同一套模型在两种完全不同的在轨计算环境中跑通。Kanyini是独立的政府卫星,IMAGIN-e则是空间站的挂载载荷,硬件架构和算力约束差异显著。能同时适配,说明压缩后的模型对边缘计算场景足够友好。

开源策略在这里的作用被放大了。太空硬件迭代周期长、成本极高,如果每个研究团队都要从零训练模型,重复投入难以想象。Prithvi的开放许可让 Adelaide 团队可以直接拿现成权重做适配,把精力集中在"怎么在太空跑起来"而不是"怎么训一个能用的模型"。

地球观测行业来说,在轨AI意味着数据不用全部传回地面处理。卫星拍到的原始影像数据量巨大,带宽和存储都是瓶颈。如果能在太空直接完成筛选、识别、甚至生成初步分析结果,只把关键信息下传,整个链路效率会完全不同。洪水和云层检测正是这类"先筛后传"场景的典型需求——前者关乎应急响应时效,后者影响影像可用性判断。

NASA和IBM 2023年发布Prithvi时,定位就是"为地球科学社区提供可扩展的基础工具"。这次上天验证,算是把"可扩展"的含义从地面服务器延伸到了太空边缘节点。Murphy强调的"加速未来",眼下看至少包含两层:技术层面,开源模型降低了太空AI的准入门槛;协作层面,跨国、跨机构的研究团队可以基于同一套基座各自探索应用场景。

接下来值得观察的是,这次验证的压缩方案能推广到多大程度的模型规模,以及不同卫星厂商的硬件差异会不会形成新的碎片化。Prithvi目前的能力边界已经明确:13年数据训练的泛化基础,加上特定任务的轻量微调。但更大参数量的模型能否以类似方式上天,还要看压缩技术和在轨算力的博弈。