打开网易新闻 查看精彩图片

一个普通产品经理想知道上周注册转化,平均要等4.7小时——这是Gartner 2023年的调研数字。不是技术栈不够强,是"问数据"这件事被锁死在两个世界里:会SQL的人不想被打断,不会的人永远在排队。

今天GitHub上冒出一个0.1.0版本的开源项目,想把这道墙拆了。ThreadQL不做新界面,直接把数据库问答塞进了Slack线程里。

「为什么我不能像问人一样问数据库?」

「为什么我不能像问人一样问数据库?」

项目作者emtay在自述里写了这个场景:产品侧的人急着要答案,开发侧的人被"帮我跑个简单查询"打断到崩溃。两边都是合理的痛苦,但中间没有桥。

ThreadQL的解法很直白——你就在Slack里打字提问,它返回数据。不用切Tab,不用等排期,不用解释"那个表格里第三列其实是第二列的别名"。

具体能问什么?作者举了三个例子:"这个月多少用户注册?""营收最高的产品是哪个?""哪些订单还没发货?"——全是业务语言,零SQL痕迹。

需要原始数据做透视?让它导出CSV,文件直接丢在Slack线程里。Excel选手可以继续用Excel,只是省去了找人要数据的环节。

开源背后的算盘:不是卖工具,是改规则

开源背后的算盘:不是卖工具,是改规则

emtay明说了:这不是要变现的产品,是"属于社区的工具"。这个表态本身就有信息量——同类赛道里,TextQL、Definite这些选手都在走商业化路线,ThreadQL选择先铺开源。

打开网易新闻 查看精彩图片

技术实现上,它押了几张安全牌:只允许多数SELECT查询、支持SSH跳板机、可选的审批流。对企业IT来说,这比"我们用了AI所以很安全"的话术实在得多。

架构层面做了多租户、LLM供应商自动降级、MySQL和PostgreSQL双支持。部署给Helm Chart和docker-compose两条路,带管理面板——基本是冲着"让运维不头疼"去的。

但0.1.0的版本号也诚实。作者自己备注:"测试能测的都测了,但可能有漏网之鱼。"这种措辞在开源项目里少见,通常大家会写"生产就绪"然后等用户踩坑。

Slack作为战场:为什么选这里?

Slack作为战场:为什么选这里?

数据工具的界面战争打了十年。BI仪表盘、Notebook、低代码平台……每个都声称降低门槛,结果往往是再造一个需要学习的新门槛。

Slack/飞书/钉钉的渗透率是另一回事。2024年Slack日活用户超2000万,中国企业微信和钉钉更夸张——工作流已经在这里,不需要迁移成本

ThreadQL的赌注是:问答界面不需要新界面。这个判断和Notion AI、Claude的Slack集成思路一致,但方向更垂直——只干"查数据库"这一件事。

有个细节值得玩味:它叫ThreadQL,不是ChatQL。线程(Thread)是Slack的特定结构,意味着对话有上下文、可回溯、能@人。这比单条消息更符合"协作式探查数据"的场景——你可以在一个线程里连续追问,同事能看到全过程。

自然语言查数据的坑,它躲开了几个?

自然语言查数据的坑,它躲开了几个?

打开网易新闻 查看精彩图片

这个赛道的前辈们踩过的雷,ThreadQL至少表了态:

幻觉问题——LLM生成的SQL可能错得自信。ThreadQL的应对是"参数化查询+可选审批流",把最终执行权留在人手里,而不是完全信任模型。

权限问题——不是所有人该看所有表。多租户架构+SSH跳板机,说明作者想过企业级部署的场景,不只是Demo。

成本问题——LLM调用费钱。支持多供应商降级,意味着OpenAI挂了可以切Anthropic或本地模型,避免单点故障。

但这些是设计意图,不是验证结果。0.1.0的真实表现,要等社区反馈。

一个产品经理的野望

一个产品经理的野望

emtay的愿景写在最后:"你有问题,在Slack里问,得到答案。就这样。"

这句话省略了一个前提:数据库已经是企业的活知识库,只是查询接口太烂。ThreadQL不造新数据,只造新接口——用自然语言替代SQL,用Slack替代BI工具。

这个定位很聪明。它不争"替代数据团队",而是"让数据团队少被打断";不承诺"人人会分析",而是"人人能问到数"。

GitHub仓库刚公开,星标数还在爬坡。但有个信号可以参考:作者专门写了"如果这对你有用,点个star帮别人发现它"——这是开源项目冷启动的标准话术,也说明还没进入自然增长阶段。