AI读不懂公文格式？权威信息正在被误读

算力游侠

2026-05-14 08:51 ·北京

市政厅昨天发布的沸水警示，AI却说是"已解除"。

这不是幻觉。系统确实抓到了两份文件：一份是三天前的旧通知，一份是昨天更新的延续公告。格式不同，AI当成了同一件事，时间线直接拧巴。人类看一眼版头就能分清，机器却把两段话揉成一个错误结论。

问题出在AI的阅读方式上。它不"看"文件，而是拆解碎片——句子、段落、埋在不同位置的元数据——再用统计关系重新拼接。结构在这里是次要的。写在正文里的时间戳，和填在标准字段里的，权重可能完全不同；某个部门的全称和缩写，系统未必认得出是同一个。

PDF公告、HTML网页更新、社交媒体摘要，描述的是同一件事，表达方式却互不兼容。AI试图调和，代价是压平那些原本清晰的区分：谁发的、什么时候发的、现在还有没有效。内容留下了，但权威性和时效性的信号在衰减。

这种衰减不是随机的。政府公文本来为人类设计，靠上下文补全信息。AI依赖的却是一致性。部门名称一处写全称、一处写缩写，归属就变得模糊；时间戳格式各异，或者藏在叙事文本里，"最新"就成了不确定的概念。

误差会累积。每一次解读都引入轻微扭曲，没有统一结构锚定数据，扭曲就层层叠加。一份明确的权威声明，渐渐变成众多互相竞争的信号之一，各自带着模糊的权重。

这催生了一类新系统：机器可读的发布机制，让AI能可靠识别权威来源、正确归属陈述、并带明确出处和时间戳地引用信息。这类需求在政府机构场景尤为突出——权威、管辖权、公共归属必须保持清晰。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴