拍照验真假：我做的Gemini事实核查工具终于不翻车了|gemini|密钥|数据包

周三晚上十一点，一堆考试资料还没翻完，顺手刷了一眼家庭群——三姑转发“央视曝光：这几种蔬菜全身都是农药”，二舅贴出“马斯克说2025年全人类要登陆火星”。你明知道多半是瞎编的，可要把每条都查清楚，光翻网页就得花半小时。那会儿就特别想要一个工具，对着屏幕拍个照就能知道这些话哪里不对劲。

最近，在GitHub Finish-Up-A-Thon挑战赛上，有开发者把一个憋了很久的想法做出来了：F.A.C.T（Fact-Checking & Analysis Tool）。名字听起来挺唬人，但逻辑直接——你把一段文字打进去，或者拿手机镜头对准报纸标题、推文截图，它几秒内就给你一份有来源、有打分的事实判定。这位开发者在提交备注里坦承，“这东西之前一直不好用，直到最近才真跑通了”。

核心变化藏在背后那条实时联网管道里。一般AI模型给的回答，往往靠的是训练数据里背下来的模式，遇到新闻热点很容易张冠李戴。F.A.C.T接的是谷歌的Gemini 1.5 Flash模型，但有一步关键操作：开了Live Google Search grounding。直白说，就是模型不翻自己的“记忆库”去猜，而是每次接到核查任务，立刻联网进搜索引擎抓一批最新网页，再把查到的来源作为判断依据。返回的东西不止一句“这消息大概率为假”，而是把找到的具体文章链接列出来。

返回的数据包里塞了好几样东西。首先是一个0到100的置信度分数，一眼就能看出它的把握有多大。然后是一段用白话写的分析，告诉你这条消息哪里可能有问题、对照了哪些信息。所有参考过的网页都做成可点开的链接，方便你自己二次验证。它还附带一个独特的指纹哈希值，你完全可以把这次核查的结果存下来或者转发给别人，哈希不变就意味着结论没被篡改。

图像那条路用的是Tesseract.js做纯浏览器端OCR。也就是说，你拍下报纸标题的瞬间，文字识别全在你自己的设备上完成，抽出来的文字直接就送进事实核查流水线。不用上传原图到云端，也不用等它转半天。对着截图拍照的操作，在当前各种短消息满天飞的环境里，确实比手动打字要快一截。

从工程上看，这东西走的是微服务架构，前端和后端通过RESTful API来回对话。代码仓库里给了一行pip install -r requirements.txt就装齐依赖，同时留了环境变量配置的模板，得自己填好API密钥和数据库连接信息才能跑起来。整个项目算不上大而全，但恰好把“输入一句判断句、输出一条有来源的结论”这条链路理顺了。

有意思的是，这位开发者在注释中写，自己考季刷社交媒体时碰上大量真假莫辨的消息，才真正下了决心把原型推到能用的状态。这个痛点的精准描述，也解释了为什么功能上这么“偏科”——它不和你聊天，不给你写诗，就只干事实核查一件事：给你半真半假的叙述打出一个分，同时把信息源推到台面上。对于每天被耸动标题轰炸的人而言，有没有来源这一点，恐怕比AI说“我觉得是真的”管用得多。