一家拥有65年历史的联邦机构,手握比任何商业公司都完整的太空失效数据库,却鲜少被外界提及。现在,它正把这些数据喂给人工智能——而美国政府和马斯克们,都在等着看结果。

数据霸权从何而来

打开网易新闻 查看精彩图片

美国太空公司(Aerospace Corp.)的总部藏在洛杉矶郊区的埃尔塞贡多,没有发射塔,没有火箭工厂,但这里存储着自1959年以来几乎所有美国卫星的测试记录、在轨故障和失效分析。

65年。超过半个世纪的连续观测。

这个数字意味着什么?当SpaceX的星链卫星批量失效时,他们能追溯的样本只有几年;当亚马逊的柯伊伯项目遇到热控问题,他们能参考的同类案例屈指可数。而Aerospace的数据库里有:冷战时期侦察卫星的密封圈老化曲线、GPS早期星座的铷钟失效模式、军事通信卫星的太阳能电池衰减规律——这些用真金白银和任务失败换来的经验,从未对外公开。

「太空环境依然极其残酷且毫不留情,」首席执行官坦尼娅·彭伯顿(Tanya Pemberton)在接受SpaceNews采访时说,「一旦发射卫星,你大概率得接受既定事实。」

彭伯顿本人就是这套体系的产物。她曾在休斯航天与防务公司(Hughes Space and Defense)担任航天工程师,随后在国家侦察局(NRO)和国家地理空间情报局(NGA)度过了整整二十年。2024年9月接任CEO后,她的核心任务只有一个:让这座数据金矿产生复利效应。

联邦资助研发 centers(FFRDC)的特殊身份给了Aerospace独特优势。它既非政府雇员,也非商业承包商,而是介于两者之间的「第三空间」——直接为美国太空军、国家侦察局和NASA服务,同时保持技术中立性。这种身份让它能接触到最敏感的军事卫星数据,又不被政府采购法规完全束缚。

AI训练的「脏数据」优势

彭伯顿透露,Aerospace正在用这些数据训练人工智能模型,目标指向两个具体场景:辅助航天器设计决策、加速异常诊断。

这里有个反直觉的事实:在AI时代,「干净数据」未必比「脏数据」更有价值。

商业航天公司追求标准化、可复用的数据集——星链的4000颗卫星本质上是一个设计参数的批量复制。但Aerospace的数据库充满了异质性:不同年代、不同供应商、不同技术路线的失败案例,夹杂着手写笔记、扫描图纸、早期数字格式的混乱记录。这种「噪声」在传统机器学习中是负担,在大语言模型(LLM,Large Language Model)时代却成了特征。

原因很简单:真实的工程决策从来不是干净输入、干净输出的过程。一个1970年代的电源系统故障报告可能包含当时工程师的直觉判断、政治压力下的妥协方案、以及事后证明错误的假设——这些上下文对AI理解「为什么这样设计」至关重要。

Aerospace的模型训练策略尚未公开细节,但彭伯顿的表述值得玩味:「inform spacecraft designs」(为设计提供信息),而非「automate spacecraft designs」(自动化设计)。这个措辞差异暴露了核心定位——他们想做的是增强人类工程师的判断力,而非取代。

异常诊断是另一个高价值场景。卫星在轨出现异常时,地面团队面临典型的信息不完全决策: telemetry(遥测数据)有限、时间压力巨大、错误诊断代价高昂。Aerospace的数据库覆盖了从「症状」到「根因」的完整链条,包括那些最终未能挽救的任务——这种「负样本」恰恰是商业公司最缺乏的。

「政府提供人才」:一种新型公私合作

彭伯顿上任后力推的一项创新,被命名为「government-furnished talent」(政府提供人才,GFT)。这个概念刻意呼应了国防采购中的经典术语GFE(government-furnished equipment,政府提供设备),但逻辑完全反转。

传统GFE是政府把硬件塞给承包商:「用这个雷达,按这个规格做。」GFT则是政府把人才和基础设施开放给商业公司:「我们的工程师、我们的实验室、我们的数据,你可以按需调用。」

具体运作方式仍在与政府赞助方磋商中,但彭伯顿的意图清晰:打破FFRDC与商业航天之间的防火墙。

这背后是更深层的生态变化。美国太空军、NRO和NASA都在高调宣扬「快速整合商业能力」,但实际操作中面临结构性障碍:商业公司不熟悉军用标准,政府工程师不了解商业节奏,双方缺乏共同的技术语境。Aerospace试图成为翻译器和加速器——用其65年积累的技术信用,降低政府与商业之间的交易成本。

「我们正处于帮助政府利用私营部门所提供能力的最前沿,」彭伯顿说。

一个值得追问的细节:GFT的收费模式是什么?FFRDC的运营成本由政府全额拨付,向商业公司开放服务是否涉及交叉补贴?这些问题可能影响GFT的可持续性和公平性,但采访中未涉及。

太空生态的三重驱动力

彭伯顿用三个关键词概括当前变局:商业化与商品化、太空成为争议领域、颠覆性技术(AI与自动化)。

第一点指向数量爆炸。高度增殖的星座(highly proliferated constellations)不再是概念,而是星链、OneWeb、柯伊伯共同验证的现实。当在轨卫星数量从数百跃升至数万,传统「每颗卫星都是定制艺术品」的研制模式彻底破产。Aerospace的数据优势在此显现:他们见过批量生产时代的质量控制失效模式——1980年代铱星 predecessor(前身)项目的教训就躺在档案库里。

第二点关乎地缘政治。彭伯顿的表述克制而明确:「太空明显是一个争议环境,且太空已编织进我们一切活动的肌理。」作为前NRO和NGA官员,她对反卫星武器、轨道威胁、供应链安全的理解是嵌入肌肉记忆的。Aerospace的AI项目必然包含分类级别的应用,采访中未被追问,但存在性是公开的。

第三点是技术本身的递归效应。AI既是被研究的对象,也是研究工具。彭伯顿提到用AI加速异常诊断,但未提及的是:AI本身正在成为航天器的新故障源。神经网络的可解释性缺陷、对抗样本攻击、训练数据投毒——这些新型风险尚无历史数据可供学习,Aerospace的65年经验在此刻归零。

被低估的桥梁角色

Aerospace Corp.的公众知名度远低于SpaceX或蓝色起源,但其结构性位置极为关键。它是美国政府与商业航天之间的「可信第三方」——既懂政府的保密需求和安全标准,又理解商业公司的成本约束和创新节奏。

这种桥梁角色的价值在特定场景下不可替代。例如,当一家商业遥感公司希望向NRO出售数据服务时,双方需要共同的技术语言来定义「图像质量」「时延要求」「安全合规」。Aerospace可以基于其历史数据库,提供中立的性能评估和风险分析,降低交易摩擦。

GFT倡议的深层逻辑在此浮现:与其让政府官僚学习硅谷速度,或让创业公司适应华盛顿节奏,不如把Aerospace变成可租赁的「双语能力」。商业公司按项目购买其工程师时间和实验室资源,政府则通过FFRDC机制保持 oversight(监督权)。

风险同样明显。Aerospace的核心资产是技术中立性,而GFT可能将其卷入具体商业竞争。如果同时服务相互竞争的两家卫星制造商,如何处理利益冲突?如果某家公司的AI模型在Aerospace基础设施上训练后表现优异,这是否构成不公平优势?这些治理问题尚未有公开答案。

数据垄断的边界

65年数据积累构成了事实上的垄断,但这种垄断有明确边界。

首先是时间边界。Aerospace的数据优势止于美国境内、止于政府任务。欧洲航天局(ESA)的失效数据库、中国航天科技集团的内部经验、俄罗斯继承的苏联遗产——这些不在其覆盖范围内。全球太空经济的碎片化,意味着不存在真正的「全知」数据库。

其次是技术代际边界。Aerospace的经验深度集中在传统大型卫星平台,对小型化、模块化、软件定义卫星的覆盖相对薄弱。当商业公司用迭代速度换取经验深度——星链用4000颗卫星的「活体实验」快速学习——历史数据的预测价值可能被稀释。

最后是AI本身的边界。彭伯顿强调「为设计提供信息」而非「自动化设计」,这种克制可能源于对AI局限性的清醒认识:航天器设计涉及多目标优化(成本、可靠性、性能、进度),权重分配本质上是政治和商业判断,而非纯技术问题。AI可以压缩搜索空间,但不能替人承担决策责任。

为什么这件事值得持续关注

Aerospace的AI项目是一个微观样本,折射出美国太空治理体系的深层调整:用FFRDC的灵活身份,嫁接政府数据资产与商业创新能力;用历史积累的「暗知识」,对冲技术迭代的不确定性;用「人才租赁」模式,重构公私合作的成本分担机制。

其成功与否,将直接影响美国太空军「快速整合商业能力」口号的落地程度。如果GFT模式跑通,可能催生更多FFRDC的类似实验——能源部国家实验室、国防部高级研究计划局(DARPA)的衍生机构,都可能跟进。反之,若治理冲突或技术瓶颈暴露,将为「政府数据资产商业化」的边界划定提供反面教材。

对中国航天产业的启示是间接但具体的。当竞争对手拥有跨越65年的连续失效数据库,且正在用AI提取隐性知识时,碎片化的项目制经验积累是否足够?如何在不依赖强制集中化的前提下,构建可共享的工程知识基础设施?这些问题没有标准答案,但提问本身是必要的。

彭伯顿的采访留下一个开放空间:她多次提及「讨论中」「探索中」,却未给出任何具体时间表或量化目标。这种模糊性可能是FFRDC文化的自然延续——远离公众视线,在保密边界内运作——也可能是战略性的节奏控制,避免过早承诺引发不必要的政治 scrutiny(审查)。

无论如何,一家拥有65年历史的机构选择在其古稀之年前拥抱AI,本身就是一个信号:太空竞赛的下一个战场,可能不在发射台,而在数据仓库和模型训练集群里。

当商业航天公司争相用更多卫星、更快迭代、更低成本改写行业规则时,Aerospace押注的是另一条路径——用时间深度换取预测精度,用历史连续性对抗不确定性。两种逻辑并非互斥,但它们的互动将定义未来十年太空系统的可靠性基准。

最后一个问题留给读者:如果中国要建设自己的「太空失效知识基础设施」,是应该学习Aerospace的FFRDC模式,还是探索完全不同的组织形态?毕竟,65年的数据积累无法速成,但技术范式的跃迁可能让某些历史经验突然贬值——这个悖论,是所有后发者都必须计算的。