在1964年的黑色喜剧《奇爱博士》中,一项名为“R计划”的紧急战争方案允许精神失常的美国空军指挥官杰克·里珀在未经总统授权的情况下发动核打击。当总统、参谋长联席会议成员和苏联大使在作战室集会时,轰炸机已经升空。只有里珀知道召回轰炸机所需的三个字母前缀。随后,他的助手莱昂内尔·曼德雷克从里珀的笔记中拼凑出了这个代码。

打开网易新闻 查看精彩图片

尽管几乎所有战机都被召回,但一架受损的B-52轰炸机未能接收到指令并成功投下炸弹。这一举动触发了苏联秘密的“末日机器”,最终导致全球毁灭。

这部电影的教训不仅关乎核武器,更揭示了关键系统缺乏有效管控时可能引发的后果。如今,类似的失控风险正在美国军方的综合指挥平台治理中重演。

这些平台的定义层例如界定威胁级别或冲突升级阈值属于承包商的专有知识产权。外界认为,这些核心规则不受军方程序的约束,且随时可能在毫无预警的情况下被更改。

利益披露:我是心智联盟系统公司的创始人兼首席执行官,该公司为国家安全客户提供情报和兵棋推演解决方案。因此,我与国防承包业务的结果存在利益关联。

正是这份工作让我对美国政府过度依赖综合指挥平台深感担忧。政府既不拥有这些平台,也未能对其进行有效治理,这可能导致决策建立在不充分的信息之上。

归根结底,如果一支军队无法掌控自身的分类标准,就无法在机器速度的现代战争中有效作战。

分析人士指出,模块化开放系统方法或许能解决这一问题。尽管该方法不可或缺,但仅靠它还远远不够。

这种方法只能规范技术接口层,却无法触及语义层。这就使得供应商依然能够保留对本体论即概念体系的控制权。

虽然美国军方在现实中可能不得不接受商业平台一定程度的“供应商锁定”,但军方应拒绝将决定平台如何认知世界的定义权外包。军方必须保留修改这些定义的权力,以防供应商或代理型人工智能以快于任何审查程序的速度篡改本体论定义。

打开网易新闻 查看精彩图片

综合指挥平台将来自军方和情报机构的数据融合到操作界面中,帮助用户提升态势感知能力、评估备选方案并做出决策。

如今,诸如帕兰提尔公司的“哥谭”系统和五角大楼的“联合全域指挥与控制”系统等综合平台,每天都会从作战数据库、卫星图像和信号情报中提取数以亿计的数据点,并跨越不同的保密级别。

这些系统对日益复杂的作战环境进行建模,其方式直接塑造了每一个主要作战司令部的决策环境。

这些系统高度依赖本体论,即由概念、类别及其相互关系构成的结构化框架。该框架负责解释何威胁、“战备”的含义以及冲突升级的阈值在哪里。

打开网易新闻 查看精彩图片

谁控制了这张“地图”,谁就决定了系统会注意到什么或忽略什么,同时也决定了指挥官所看到的备选方案的优先级。

美国政府对其“地图”并不具备“表征主权”。简而言之,政府并未拥有和治理其所依赖的权威本体论和综合指挥平台。

通过一系列看似无害的独立合同和许可协议,系统的定义层已经被让渡给供应商,成为他们的专有知识产权。

正是这个定义层,决定了系统中“威胁”、“战备”和“冲突升级”的具体含义。

一旦平台标记出某个威胁,这些分类就会出现在简报中,进而影响指挥决策。这一过程实际上将供应商的本体论选择变成了事实上的军事准则。

即使决策室内坐满了经验丰富的官员,那些限制分析师和领导者思维的最关键的框架性决策,也早已由不在场的人做出了。

如果供应商聘请专家来构建这些本体论,情况或许会有所不同。但在危机中,指挥官所依赖的分类标准往往由软件工程师掌控。

这些工程师虽然聪明且具备在岗学习能力,却缺乏实战经验或区域专业知识。危机管理学者耗费数十年时间,在国际危机行为项目和国家间军事争端数据中不断完善分类法。

供应商的工程师可能会为了满足应用程序的需求而临时拼凑分类标准。他们没有借鉴危机学者或军事准则专家的研究成果,也未曾使用关于真实危机演变的前沿研究来检验系统的概念模型。对于自己做出的本体论选择或更改,这些工程师无需承担任何军事准则上的责任。

打开网易新闻 查看精彩图片

在危机爆发时,领导者极不可能去质疑软件中内置的分类标准。

即便他们真的提出质疑,往往也为时已晚。

当“地图”生成令人意外的结果时,人们的本能反应是寻找技术层面的解释,比如参数配置错误或数据源异常。那个由非专家运行且缺乏数十年冲突研究支撑的底层模型,却极少受到质疑。

根据我的经验,大多数高级将领都想当然地认为平台的分类反映了已发布的军事准则。很少有人真正见过底层的本体论,知道其编写者身份的人更是寥寥无几。

官员们在权衡利弊并讨论备选方案时,其对话逻辑极少能跳出系统设定的框架。即使系统得出的结果值得商榷,也没有人要求建立一个基于不同假设的备用模型。

这也给军事机构造成了重大损失,因为它们从未经历过界定自身概念内涵的严谨过程。当操作人员、情报官员和军事准则专家就“危机前信号”是一个独立类别还是“灰色地带活动”的子集展开辩论时,机构内部的共识便得以确立。

将本体论外包,实际上就是将这种学习过程外包。假设一个平台的“危机前信号”阈值是针对特定战区和特定对手进行校准的。

当另一个对手调动军队时,经验丰富的区域分析师能立刻察觉这是备战行为,但系统却显示为安全状态。

分析师给出的评估是警告状态。由于分类标准是专有的,她根本无法向指挥官准确指出模型的假设究竟在何处与她的判断产生了分歧。

组织管理学研究表明,当企业将核心竞争力外包时,就会丧失战略优势。这些核心竞争力是贯穿各类产品并能开拓多个市场的独特能力。

政府机构同样如此。界定何为威胁、明确“战备”的作战含义以及确定冲突升级的阈值,正是指挥体系的核心竞争力。

这种能力贯穿于每一个平台和每一个作战司令部,并在每一次危机中发挥作用。一个无法在自身系统中定义“冲突升级”的国家,注定无法完全掌控自身的升级决策。

目前,法律要求重大国防采购项目必须采用模块化开放系统方法,这通常被视为解决上述问题的良方。该方法确实是一项实质性进步:它强制要求模块化设计、开放接口标准以及机器可读的接口定义。

同时,它赋予了政府更强大的数据权利,以避免在组件层面被供应商锁定。这种方法仅仅规范了技术接口层,即系统如何连接和交换数据,却未能触及定义层和本体论层面。

两个平台可能在每一个应用程序编程接口边界上都完全合规且互操作,但它们依然运行在没有任何项目办公室拥有所有权的供应商专有本体论之上。

需要明确的是,这并非因为模块化开放系统方法设计存在缺陷,而是因为本体论治理是一个独立且平行的制度框架。根据《2026财年国防授权法案》,美国国防部现已在首席数据官麾下法定设立了一个独立的本体论治理架构。

该架构旨在整个部门内建立基础的本体论标准。这一框架仍处于起步阶段,那些最急需定义治理的指挥平台尚未被纳入这一新兴结构中。

打开网易新闻 查看精彩图片

模块化开放系统接口架构与首席数据官的本体论治理之间存在的鸿沟,依然是决策系统的一个致命弱点。

人工智能的广泛应用正在加剧这一问题。目前,许多供应商正在使用人工智能进行编程,并将其整合到应用程序中。

代理型人工智能系统已经在进一步修改现有的定义层。当人工智能编程助手重构代码库时,为了提高代码的一致性,它可能会重命名类别、合并阈值或重组分类逻辑。

在这个过程中,人工智能根本意识不到这些标签承载着军事准则的深层含义。自动化的数据处理流程可能会基于模式匹配而非军事准则对实体进行重新分类。

每一次修改看似微不足道,但日积月累,它们将彻底重写整个“地图”。

这些系统生成的“地图”可能在语法上是连贯的,但在战略上却毫无逻辑可言。诸如“灰色地带准备”或“危机前网络塑造”等新类别、新阈值和新评分逻辑的引入速度,远远超过了军事准则的更新速度。

审查委员会也根本来不及察觉这些变化带来的深远影响。随着应用层的规则、阈值和临时类别在未经机构审查的情况下被不断修改或添加,模型漂移现象便会逐渐发生。

在缺乏明确版本控制和审计跟踪的情况下,“地图”将发生实时漂移。这会在无人授权的情况下,悄然重塑领导者对危机的认知框架。

当人工智能在定义模糊的术语和类别上运行时,它将生成看似自信却极具误导性的答案。

一支拥有自身本体论的军队将获得决定性的战略优势。

如果人工智能系统运行在由政府控制且基于军事准则的定义之上,它们将变得更加敏捷、更具韧性,同时也更难被对手利用或操纵。

短期来看,美国军方应首先确保夺回对本体论的控制权。

然而从长远来看,军方必须重新评估定义的标准化方式以及日常数据维护的执行机制。

首先,机构可能并不清楚其“地图”是否被私人供应商所掌控。

为了解答这个问题,必须找到本体论并分析数据映射到各个类别的方式,进而判断其是否易于理解。

现阶段,需要回答以下四个问题:这张“地图”是否与你们对该领域关键方面的共识相符?数据是否忠实地按照本体论进行呈现?当事件和局势不再与本体论保持一致时,你们能否实时察觉?你们能否随意对其进行修改?

如果其中任何一个问题的答案是否定的,那就意味着你们并未真正掌控自己的“地图”。

在这种情况下,必须像处理其他被供应商锁定的软件产品一样,将“地图”与私人供应商解绑。正如大卫·麦库姆在《软件荒原》一书中所指出的,以应用程序为中心的思维模式是导致政府和企业被供应商锁定的根源。

在这种模式下,每个平台都自带一套解释数据含义的模型。虽然应用程序应该是不断迭代的,但定义必须保持持久性,而当前的采购模式却加剧了这种捆绑。

当美国国防部直接购买平台,而不是要求供应商基于政府拥有且开放标准的定义进行开发时,供应商锁定就成了合同层面的默认结果。

解决这一问题的架构原则非常明确:将定义与使用这些定义的平台彻底分离。需要设计一种分层架构,使数据、定义和应用程序界限分明。

这样一来,在更换工具时,核心概念能够保持不变,改变的仅仅是接口。这意味着本体论属于机构而非产品,它应被视为共享的基础设施,而不是某一个应用程序的附属功能。

打开网易新闻 查看精彩图片

另一个亟待关注的关键领域是跨司令部和跨“地图”的本体论标准化。军方已经通过结构化的审查程序来管理军事准则定义和情报数据库。

将这种严谨的纪律延伸到指挥平台内置的本体论中,并非创造一种全新的治理模式,而是对现有治理机制的迟到应用。

当前的核心任务是开发基于军事准则的本体论。这需要以“联合准则本体论”为蓝本,建立在“基础形式本体论”之上。

同时,必须使用标准的形式化语言如资源描述框架或网络本体语言来呈现这些本体论,以便机器能够读取和使用。

开发于2010年代的“联合准则本体论”,是一项旨在将联合出版物定义转化为机器可读形式的概念验证工作。它不仅证明了这种方法的可行性,也暴露了其中的核心难题。

军事准则的编写初衷是为了让人类能够灵活解读,而本体论则需要软件所依赖的精确且毫无歧义的定义。

弥合军事准则的通用性与计算的精确性之间的鸿沟,正是目前供应商工程师在缺乏充分监管下所从事的工作。

解决问题的关键在于,将本体论中的每一个元素都与指挥官需要解答的具体作战问题紧密挂钩。例如,“该部队能否在72小时内完成部署?”或者“这种活动模式是否构成危机前信号?”

这种做法远胜于对军事概念进行抽象建模。基于核心能力问题构建的本体论,能够保持精简、可测试,并始终与实际决策紧密相连。

外界可能认为,项目办公室已经通过配置控制委员会或在项目内部处理了这一问题。这种治理通常仅局限于单一平台。

那个塑造领导者对战场认知的、跨越多个项目的本体论“地图”,目前处于无人负责的状态。当三个不同的项目以三种截然不同的方式定义“战备”时,没有任何一个单一的项目办公室能够出面解决这个共性问题。

与其过度依赖人工智能来简化维护工作,不如将本体论的维护视同军事准则和战斗序列管理。这需要明确所有权,要求任何修改都必须基于联合出版物和同行评审研究的论证,并详细记录所有变更。

真正的解决方案是,将权威的本体论作为一道必经的过滤程序,确保人工智能的输出在传达给人类操作员之前,必须先经过这道关卡的检验。

一个由操作人员、情报官员、系统工程师以及研究危机行为、冲突升级动态和冲突数据集的外部学者组成的“联合本体论委员会”,应当负责主导这一进程。

随着兵棋推演和军事演习揭示出新的模式,作战审查暴露出险些酿成大错的隐患,以及国际危机行为和国家间军事争端等项目对危机进行观察和编码,必须建立一个结构化的流程,将这些宝贵的发现反馈到指挥系统所使用的本体论和分类中。

在这个委员会中,军方将拥有绝对的最终权力。他们可以访问现有的供应商本体论,批准定义和阈值,并强制执行审计跟踪,以确保每一次修改都被详细记录、可供审查且能够撤销。

治理工作还必须解决“地图”所声称的真实性问题。如果目标数据库将一栋建筑归类为军事设施,但当打击方案制定完毕时,该建筑已经变成了一所小学。在这种情况下,本体论在定义上或许是无懈可击的,但在事实上却大错特错。

一个治理良好的本体论,会要求每一个具有作战意义的实例都必须附带强制性的时间元数据。这些数据包括:该分类最后一次验证的时间、支撑该分类的证据是什么,以及在投入实际作战前何时必须进行再次确认。

像“军事设施”这样的类别,应当包含一个机器可读的有效期限。在任何带有该标签的实例进入作战决策流程之前,系统都会自动触发重新验证机制。

如果本体论及其所需的元数据由供应商控制,军方就无法强制要求添加这一字段。相反,如果它由政府拥有,军方就可以直接将这一验证机制嵌入到“地图”本身之中。

接下来的挑战更为艰巨:如何将该框架的触角延伸至那些一旦发生本体论失效将造成最严重后果的指挥平台。

如果无法实现这种整合,美国将面临部署速度虽快但极度脆弱的人工智能系统的风险。这些系统以机器速度处理海量数据,但其运行所依赖的定义,却没有任何一位指挥官能够完全掌控,没有任何一位军事准则专家曾经审查,同时也没有任何一个对手的情报机构会忽略对其进行深入研究。

在《奇爱博士》中,召回代码根本就没有得到妥善的控制。如今驱动指挥平台的本体论同样面临着这种失控的窘境。

掌控“地图”绝非官僚体制的细枝末节。这是部署真正更快捷、更具杀伤力且更难被欺骗的系统的先决条件,而不仅仅是追求更高程度的自动化。