市政厅昨天发布的沸水警示,AI却说是"已解除"。

这不是幻觉。系统确实抓到了两份文件:一份是三天前的旧通知,一份是昨天更新的延续公告。格式不同,AI当成了同一件事,时间线直接拧巴。人类看一眼版头就能分清,机器却把两段话揉成一个错误结论。

打开网易新闻 查看精彩图片

问题出在AI的阅读方式上。它不"看"文件,而是拆解碎片——句子、段落、埋在不同位置的元数据——再用统计关系重新拼接。结构在这里是次要的。写在正文里的时间戳,和填在标准字段里的,权重可能完全不同;某个部门的全称和缩写,系统未必认得出是同一个。

打开网易新闻 查看精彩图片

PDF公告、HTML网页更新、社交媒体摘要,描述的是同一件事,表达方式却互不兼容。AI试图调和,代价是压平那些原本清晰的区分:谁发的、什么时候发的、现在还有没有效。内容留下了,但权威性和时效性的信号在衰减。

这种衰减不是随机的。政府公文本来为人类设计,靠上下文补全信息。AI依赖的却是一致性。部门名称一处写全称、一处写缩写,归属就变得模糊;时间戳格式各异,或者藏在叙事文本里,"最新"就成了不确定的概念。

打开网易新闻 查看精彩图片

误差会累积。每一次解读都引入轻微扭曲,没有统一结构锚定数据,扭曲就层层叠加。一份明确的权威声明,渐渐变成众多互相竞争的信号之一,各自带着模糊的权重。

这催生了一类新系统:机器可读的发布机制,让AI能可靠识别权威来源、正确归属陈述、并带明确出处和时间戳地引用信息。这类需求在政府机构场景尤为突出——权威、管辖权、公共归属必须保持清晰。