A Domain-Theoretic Foundation for Imprecise Probability and
Credal Sets
不精确概率与信度集的域理论基础
https://arxiv.org/pdf/2604.09272
摘要
我们建立了一个域理论框架,用于在具有可数基的连续开集格的一般拓扑空间上进行不精确概率的推理与推断。本文研究两种不同形式的不确定性:部分或不完整的事件描述,以及以信度集形式表示的概率分布集合——以及二者的结合。在该框架下,我们构建了条件概率理论,并推导出新的推理规则,用于在存在这两种互补的不精确类型的情形下执行贝叶斯更新。我们将这些结果进一步推广至不精确概率事件的条件独立性理论。我们还为条件概率、贝叶斯更新与条件独立性形式化了逻辑谓词,并获得了相应的可靠性与完备性结果。本文的一项核心贡献是构造了从任意信度集到区间域的Scott连续映射,从而为容量理论与Choquet积分中的经典结果提供了域理论层面的实现。最后,我们引入并研究了一类由带不精确概率权重的迭代函数系统所生成的新型信度集,拓展了计算上可处理的不精确概率模型的适用范围。由此构建的可计算框架统一了关于不确定性的逻辑、拓扑与测度论视角,为在部分信息与集值信息条件下进行鲁棒的概率推断提供了支持。
关键词: 域理论;条件概率;信度集;条件独立性
1 引言
当信息是部分的、模糊的或集值的时候,不精确概率为不确定性下的推理提供了一个鲁棒的框架。它通过允许分布集(信度集)和区间值概率,推广了经典概率论,从而在安全关键应用中能够实现更谨慎的推断。
我们考虑第二可数局部紧致Sober拓扑空间。我们将这样的空间称为基本拓扑空间。在这些空间中,开集格是一个可数基连续格 [GHK⁺03],代表着一个具有可数基的空间locale。这些基本空间包括可分局部紧致度量空间以及可数基连续域。此外,任何波兰空间都是其形式球连续域的最大元素空间 [EH98]。这意味着基本拓扑空间涵盖了概率论中使用的所有标准空间。
此外,在此类空间上的任何连续概率赋值都可以扩展为博雷尔测度 [AMESD00, KL05]。对于豪斯多夫空间,由所得博雷尔测度的外正则性,这种扩展是唯一的。
在接下来的章节中,我们在这种不精确设定下,为条件概率、贝叶斯更新和条件独立性建立了域理论基础。一个关键结果是从信度集到区间概率的 Scott 连续包络映射,它将容量理论思想和 Choquet 积分提升到了域框架中 [Cho54, Gra16, ACdCT14, GL13]。我们还引入了一类由带不精确权重的迭代函数系统产生的新型信度集。
虽然区间算术已在工程背景下应用于贝叶斯法则 [FKG⁺03],且鲁棒贝叶斯分析考虑了先验集 [Ber85],但据我们所知,精确端点公式的基于单调性的推导此前尚未发表。我们证明(引理 6.1)经典的贝叶斯更新
由于基本空间的开集格是可数基且连续的,它可以被赋予一个有效结构,使得格上的可计算开集和可计算函数可以被枚举;参见 [Plo81, Smy77]。这导致了一个针对不精确概率和信度集的可计算框架。
记号约定
对于任何基本空间,无论是豪斯多夫空间还是域,我们都用 D D 表示。当我们专门仅处理豪斯多夫基本空间时,我们用 X X 而不是 D D 来标记它。
2 域理论基础
2.1 可逼近关系
遵循不精确概率的既定框架和传统,正如经典开创性工作 [Wal91] 中详尽描述的那样,我们将为基本的域理论构造形式化谓词。这可以通过域理论中丰富的可逼近映射、locale 和 Stone 对偶性理论来实现 [Sco70, Smy77, AJ95, Abr91, Vic89]。
实际上,我们将形式化一个谓词 G G,它可以用于 (i) 为基本空间 D D 定义 P ( D ) 的 Scott 开子集的一组基,以及 (ii) 刻画 O ( D ) 上给定的连续赋值。我们考虑基本空间 D D 的开子集格的一个可数基 ,它在有限并和有限交下封闭。
我们通过如下给出的集合来定义连续赋值空间上的开集基:
3 基本空间的事件域
给定一个基本空间 D ,我们将它的开集视为可观测或半可判定谓词 [Abr91, Smy77]。由于在概率论和统计学中取事件的补集是一个基本工具,且由于开集的补集未必是开集,我们通过不相交开集来逼近开集的外部。这引导我们得出 D 的事件域 E ( D ) ,即按子集包含关系按分量排序的不相交开集对的偏序:
4 信度集
用于指代概率分布凸集的现代术语 credal set(信度集)是在后来的论述 [ACdCT14] 中标准化的,尽管其基础理论是由 Walley [Wal91] 在“概率测度集”(sets of probability measures)这一名称下发展的。
5 事件的条件概率
5.1 条件概率谓词
由于 Scott 连续映射 C 是由输入连续赋值 σ 在输入开集或其交集上的一对有理函数给出的,原则上,人们可以通过对给定运算进行复合来获得表示 C 的可逼近映射。然而,这种方法会导致相当复杂的表达式。一种更自然且直接的技术是为 C 的下端和上端形式化两个关键谓词,并将它们与表示 σ 的谓词 G 联系起来。
信度集方法产生一个区间,用以捕捉多个先验下的不确定性,而经典方法则产生一个依赖于先验任意选择的单一数值(此处为平均值)。在安全关键应用中,区间的下界提供了一个鲁棒的、风险厌恶的估计,而经典点估计可能会误判真实的不确定性。进一步的比较见表3。
6 事件的贝叶斯更新
6.1 贝叶斯推理规则
我们现在像在第 5.1 节针对区间条件概率所做的那样,为区间贝叶斯方法形式化两个谓词。这两个新谓词分别是
例 6.5. 考虑一种针对某种疾病的医学检测。设:
- H H:患者患有该疾病的假设。
- E E:检测结果呈阳性的证据。
我们拥有不精确信息:
- 先验患病率:根据流行病学研究,该疾病的患病率估计在 1% 到 5% 之间,但确切数值不确定。
- 检测灵敏度:在患病条件下检测呈阳性的概率在 85% 到 95% 之间。
- 检测特异度:在未患病条件下检测呈阴性的概率在 90% 到 99% 之间。
在经典贝叶斯分析中,通常选择点估计:
6.2 信度集的贝叶斯更新
经典点估计位于该区间内部,但未能捕捉到全部的不确定性。0.6617 的区间宽度反映了对参数 a 和 b 的显著敏感性。在安全关键应用中,这揭示了后验概率可能低至 28.6% 或高达 94.7%,而当任意选择单一精确参数集时,这些信息就会丢失。
7 扩展到多维情形
8 条件独立性
8.1 强条件独立性
在本节前文中,我们看到,当两个独立事件 U U 和 V V 以 W W 为条件时,经典条件独立性意味着下条件支撑是可分解的。在此域论设定下,我们还拥有由上条件支撑所提供的额外信息。
强条件独立性中关于右端点的额外假设具有局限性,在许多应用中不太可能成立。然而,它带来了计算上的高效性,因为条件概率的两个端点可以通过对应端点的乘积来获得。可以将强条件独立性视为在图模型中提供的一种乐观规则,用于计算条件概率的右端点。
对于强条件独立性,我们有两条额外的规则来替换 (CI7) 和 (CI8):
关于各种方法的比较,见表 5。主要区别如下:
- 经典方法:点估计 (0.56) 假设具备精确知识和完美分解。
- 弗雷歇 (Fréchet) 方法:保守区间 [0.42, 0.80] 保证了包含性,但区间较宽(宽度为 0.38)。
- 强独立性方法:区间更窄 [0.42, 0.72](宽度 0.30),但需要强分解假设。
关于实际意义,我们有:
- 诊断:如果我们需要大于 0.7 的概率来进行诊断:
- 经典方法:否 (0.56 < 0.7)
- 弗雷歇方法:可能 (0.42-0.80 包含 > 0.7)
- 强独立性方法:可能 (0.42-0.72 包含 > 0.7)
- 安全性:弗雷歇方法更安全(总是包含真实概率)。
- 效率:强独立性更高效(区间更窄)。
最后,关于何时使用每种方法:
- 弗雷歇规则:适用于安全关键应用、依赖关系未知以及保守风险评估的情况。
- 强独立性:适用于负面证据的独立性合理且效率为优先考量的情况。
- 经典方法:适用于参数精确已知且独立性假设经过充分验证的情况。
9 带有不精确概率的迭代函数系统
在本节中,我们通过考虑与基本空间的事件域对偶的域,继续架起经典容量理论 [Cho54, Wal91] 与域理论之间的桥梁。该对偶域采用基本空间的覆盖闭子集对,并按反向包含排序。利用这个对偶域,我们将一类新的信度集形式化为带有概率的迭代函数系统 (IFS) 的不变测度。
迭代函数系统 (IFS) 及其不变测度已在分形几何和动力系统中得到广泛研究,其应用范围涵盖从计算机图形学和图像压缩到自然现象建模、信号处理、生物结构分析和金融时间序列 [IFS22]。我们在本节的结果为将这些经典应用扩展到概率不确定或部分指定的场景提供了数学上严谨的基础。
在下文中,我们将考虑 IFS 的信度集。具有以区间形式给出的不精确输入的马尔可夫链的情况将在附录 B 中给出。
9.1 带有概率的 IFS 的信度集
在本小节中,我们引入一类新的信度集,即那些由带有概率的迭代函数系统 (IFS) 的不变测度组成的信度集。IFS 理论一直是多个学科中一个活跃的研究领域。
对应于该不变测度的连续概率赋值可从域论角度获得,具体为:若 X X 是紧致空间,则其为 X X 的上空间之概率幂域上 Hutchinson 算子的最小不动点;或为完备度量空间之形式球域的概率幂域上 Hutchinson 算子的最小不动点。
并且,我们获得了该不动点算子到容许集上的扩展:
9.1.1 具有不精确转移矩阵的马尔可夫链
在本节中,我们介绍并分析了带有不精确概率权重的迭代函数系统。类似地,据我们所知,附录 B 针对转移概率以不精确值指定的有限状态马尔可夫链,提供了一种新颖的论述。
结论
我们已经为不精确概率与信度集建立了一个综合的域理论基础,提供了一个统一的计算框架,该框架既能处理部分事件描述(在事件域 E ( D ) 中表示为不相交开集对),又能处理由上空间 U ( P ( X ) 中的紧致信度集所捕捉的分布不确定性。我们的主要贡献包括:在事件域上构造了 Scott 连续区间概率映射;推导出了贝叶斯更新的基于单调性的精确区间扩展,并附带了可靠且完备的推理规则;建立了针对不精确事件的条件独立性理论,包含保守(弗雷歇)与强分解规则;以及引入了一类由带有不精确概率权重的迭代函数系统生成的新型信度集,并证明了相关不动点映射的连续性。我们为相关概念形式化了逻辑谓词,并获得了可靠性与完备性结果。所有运算均 Scott 连续地扩展至信度集空间,从而确保了有限逼近的收敛性。
这项工作为信度网络与不精确贝叶斯网络的域论处理奠定了必要的数学基础。该框架保证了使用不精确参数和部分指定观测值进行的推断具有坚实的计算基础,并得到域论逼近性质以及通过可逼近映射提供的逻辑基础的支持。未来的工作将集中于构建明确的域论信度网络,开发利用此处所提出的连续性与逼近结构的精确与近似推断算法,并将该方法推广至不精确条件下的序列决策问题。
原文链接:https://arxiv.org/pdf/2604.09272
热门跟贴