当你反复对一个语言模型说“再想想”,它真的能发现错误吗?已知的研究显示,把模型自己的推理链再喂给它,只会让它锚定在原有令牌上,变成自我批准的橡皮图章。那么,把同一个问题丢给同一个模型N次,每次重开关联,再交叉比对——是不是更像分开审讯几个证人?

开放权重模型虽然便宜,但每秒吞吐几百万令牌可能只是自信的废话。真正重要的指标是每美元能产出的正确结论数。而过往的“自我纠正”和“用模型来验证模型”都只是把感觉往上一级传递,没有跳出模型判断的循环。我们需要机械的、可计算的、确定性的检查。

打开网易新闻 查看精彩图片

一个新提出的逻辑图验证系统把模型的推理过程外化为一个有向图:每个论点成为一个节点,支撑关系成为边。这样一来,即便不谈“真假”,结构本身就暴露问题——没有支撑的前提是孤儿节点,循环论证就是环,结论与证据不连通说明推论链断裂。你不再需要问“它对吗”,而是检视图是否满足无环、连通的机械规则。

信心由此变成了拓扑属性。根据门格尔定理,连接证据到结论的节点不相交链越多,结论越坚固。如果你只找到一条从证据通到结论的路,它是脆弱的;如果有三条独立路径,对手就必须同时击破三个独立的断言。关键在于独立性是“采样”出来的,而不是“要求”出来的——在一个上下文里让模型给出三个独立论证,得到的往往是同一种说法的三次转述。但当你用N次独立推理调用(每次新建上下文,温度大于零),就会产生真正去相关的尝试。不同运行之间的毛刺和矛盾,正好就是单个记录里完全看不见的审讯漏洞。

系统不是让模型泛泛地“重新审视”,而是用最小割或介数中心度算出哪条边负载最大又未经证实,然后只把计算预算投到那个点上:“边7承载全局且未验证。”模型就集中力量核查该处。这种定向注意远比稀释式的复查有效。

可能会有人觉得,把每个模糊的推理步骤写成带类型的节点和有向边是一种“形式化税”,增加了工作量。但设计者反而视其为特性:一个原本隐晦含糊的步骤,在被强制类型化后,其模糊性就变得赤裸裸可见了。这套系统最终面向的是需要在文档上做多跳问答、声明验证的研究者和开发者,输出一张可审计的论证图,并可作为智能体随时调用的MCP工具。