周三晚上十一点,一堆考试资料还没翻完,顺手刷了一眼家庭群——三姑转发“央视曝光:这几种蔬菜全身都是农药”,二舅贴出“马斯克说2025年全人类要登陆火星”。你明知道多半是瞎编的,可要把每条都查清楚,光翻网页就得花半小时。那会儿就特别想要一个工具,对着屏幕拍个照就能知道这些话哪里不对劲。

最近,在GitHub Finish-Up-A-Thon挑战赛上,有开发者把一个憋了很久的想法做出来了:F.A.C.T(Fact-Checking & Analysis Tool)。名字听起来挺唬人,但逻辑直接——你把一段文字打进去,或者拿手机镜头对准报纸标题、推文截图,它几秒内就给你一份有来源、有打分的事实判定。这位开发者在提交备注里坦承,“这东西之前一直不好用,直到最近才真跑通了”。

打开网易新闻 查看精彩图片

核心变化藏在背后那条实时联网管道里。一般AI模型给的回答,往往靠的是训练数据里背下来的模式,遇到新闻热点很容易张冠李戴。F.A.C.T接的是谷歌的Gemini 1.5 Flash模型,但有一步关键操作:开了Live Google Search grounding。直白说,就是模型不翻自己的“记忆库”去猜,而是每次接到核查任务,立刻联网进搜索引擎抓一批最新网页,再把查到的来源作为判断依据。返回的东西不止一句“这消息大概率为假”,而是把找到的具体文章链接列出来。

返回的数据包里塞了好几样东西。首先是一个0到100的置信度分数,一眼就能看出它的把握有多大。然后是一段用白话写的分析,告诉你这条消息哪里可能有问题、对照了哪些信息。所有参考过的网页都做成可点开的链接,方便你自己二次验证。它还附带一个独特的指纹哈希值,你完全可以把这次核查的结果存下来或者转发给别人,哈希不变就意味着结论没被篡改。

图像那条路用的是Tesseract.js做纯浏览器端OCR。也就是说,你拍下报纸标题的瞬间,文字识别全在你自己的设备上完成,抽出来的文字直接就送进事实核查流水线。不用上传原图到云端,也不用等它转半天。对着截图拍照的操作,在当前各种短消息满天飞的环境里,确实比手动打字要快一截。

从工程上看,这东西走的是微服务架构,前端和后端通过RESTful API来回对话。代码仓库里给了一行pip install -r requirements.txt就装齐依赖,同时留了环境变量配置的模板,得自己填好API密钥和数据库连接信息才能跑起来。整个项目算不上大而全,但恰好把“输入一句判断句、输出一条有来源的结论”这条链路理顺了。

有意思的是,这位开发者在注释中写,自己考季刷社交媒体时碰上大量真假莫辨的消息,才真正下了决心把原型推到能用的状态。这个痛点的精准描述,也解释了为什么功能上这么“偏科”——它不和你聊天,不给你写诗,就只干事实核查一件事:给你半真半假的叙述打出一个分,同时把信息源推到台面上。对于每天被耸动标题轰炸的人而言,有没有来源这一点,恐怕比AI说“我觉得是真的”管用得多。