一个计算机科学专业的大三学生,用混合策略而非纯AI路线,做出了一个准确率74.8%的GeoGuessr辅助工具。核心思路很朴素:既然人类玩家靠路牌和文字找线索,那机器也该这么干。

这个项目的pipeline分五步走。第一步是路牌规范检测,用微调过的YOLOv8m模型识别三类路牌:MUTCD(北美标准)、VIENNA(国际标准)、以及模棱两可的。第二步文字提取,目前用EasyOCR,但作者还在考虑微调以自动识别亚洲语言——现在得手动切换语言参数,比如检测到斯拉夫文字就要切到俄语模式。

打开网易新闻 查看精彩图片

第三步国家筛选是整套系统的决策中枢,又细分为三小步。先按GeoGuessr统计数据初始化各国概率分布;然后做国家排除,这里需要算一个bias值:(VIENNA总置信度 - MUTCD总置信度)/(两者之和)。bias大于0倾向VIENNA,小于0倾向MUTCD,等于0保持混合。为了保险,还设置了动态阈值:bias置信度大于0.7时阈值0.2,大于0.4时0.3,否则0.5。最后根据bias和阈值的关系决定走哪条路线。

打开网易新闻 查看精彩图片

第四步用Nominatim准备节点,把提取的文字转成实体类型和兴趣点;第五步OverPass API输出最终坐标,按500公里聚类以减少误差——如果对OCR结果不太信任,这个距离还可以调大。

打开网易新闻 查看精彩图片

作者坦承README写得比这篇分享更详细,也列出了后续方向:微调权重来识别植被、建筑风格、车辆型号等更多线索。项目已开源在GitHub。