每隔几周就有新的数据泄露新闻,但人们还是乐此不疲地把Gmail授权给各种AI工具,只为问一句"我的包裹到哪了"。一位开发者受够了这种矛盾,于是写了一个完全本地运行的AI助手——你的邮件数据,从此不必再离开自己的电脑。
这个叫Parsli的工具只做一件事:连接本地Gmail,解析物流邮件,提取追踪信息,把散落在亚马逊、UPS、各国邮政、海关通知和2009年风格小网店的订单,整理成清晰的时间线。
听起来简单,但开发者Olga在博客中写道,物流邮件其实是"surprisingly intimate dataset(惊人私密的数据集)"——它们默默暴露你在哪里购物、去哪家药房、买了什么贵重物品、何时出行,甚至何时不在家。
"我不想把这套个人行为数据流,交给又一个只有'我们重视您的隐私'页面的创业公司。"
Parsli目前还是早期原型,但开发者表示会持续推进。她自己就经常跨国跨平台购物,物流追踪很快变成跨语言、跨格式、跨承运商的混乱局面。这个项目最初只是本地AI工作流的实验,逐渐变成了她真正想用的工具。下一步计划加入短信、截图和语音消息作为输入源——毕竟物流更新散落在各个渠道,不只是邮件。
另一个设计重点是"可观测性",而非又一个黑箱AI代理。除了存储物流事件,Parsli还会持久化规则匹配记录、模型决策、置信度、提取实体、处理耗时、token用量和分类推理过程。开发者解释,邮件解析一旦离开理想demo场景,立刻变成边缘案例地狱,完整的决策轨迹让调试轻松很多。
技术实现上,Parsli采用Gemma 4作为确定性提取管道之上的推理层。很多物流邮件根本不需要大模型——亚马逊、UPS、以色列邮政和半个互联网都在发固定模板,HTML清理、追踪号提取、发票过滤、明显的物流更新,都用确定性规则和语言包处理。每封邮件都调用模型又慢又浪费。
但当邮件偏离标准模板时——多语言海关通知、追踪号埋在正文里的自提点通知、格式独树一帜的小众平台——纯规则就不够用了。这时Gemma出场,既做物流分类器,也做规则之上的审计层。管道先确定性提取结构化候选,再把模糊案例送给模型判断。
代码已开源:https://github.com/olgazju/parsli
热门跟贴