同一个客户数，六份答案：AI幻觉背后的数据真相

爬虫饲养员

2026-05-09 23:56 ·北京

你有没有遇到过这种情况？问"我们有多少客户"，得到三个不同的数字。

销售报一个数，财务报另一个，创始人打开仪表盘，跟前两个都对不上。没人撒谎，他们只是看了不同的系统，用了稍微不同的定义。而公司用这些数字做决策，已经好几个月了。

上周我在一个BI论坛看到个帖子。一位分析师把两个团队的数据仪表盘并排对比，都有"收入"这一列，数字却不一致。他追查下去："两个分析师写了两个不同的收入计算公式，一个是毛收入，一个是净收入。都没错，只是从没统一过定义。"

这是老问题的新版本。三周的另一个帖子，426个赞，楼主说CEO干掉了BI工具，让所有人"直接问Claude"要数字。结果可想而知："销售VP拉的数据跟财务对不上。Claude在编造留存率数字，因为底层数据表从2022年就没清理过。"

最高赞评论216个赞，一句话点破本质："AI只在底层数据干净、指标定义清晰时才管用。跳过这一步，Claude只是更快地把胡说八道包装成自信答案。"

问题形态不同，结构一样：定义漂移。AI加持让漂移速度翻倍。

所以我搭了一个不会漂移的agent。

我在工作区数据库里塞了大多数公司真实会有的混乱数据。两个表：一个叫stripe_customers，存账单数据；一个叫hubspot_companies，存CRM视角。同一批业务，同一批客户，对"企业级"的定义却不同。

然后我问了那个简单的问题。

同一个问题，六个数字。agent把它们全列出来，解释为什么不一致。

两个总数都显示9。但它们数的是不同的9。没人说谎，两个数字都站得住脚。agent用大白话解释原因——"同步或命名/域名不匹配，而非计数错误"。

我没写对账逻辑，没写SQL。只问了一个问题。

市面上"问AI要数字"的工具，没人聊底层在发生什么。大多分两种套路：

第一种把数据硬塞进提示词。客户表有一万行？你每次提问都要付费读完整张表。而LLM是预测引擎，不是计算器——让它加一千个数字，它会愉快地编个总数给你。

第二种在数据库外包个聊天框。AI从不真正查询，它让翻译器猜一段SQL，返回一个数字。你看不到计算过程。数字错了，你也查不出原因。

上面那个agent两种都不沾。它有真正的SQL工具。它看了表结构，自己写

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴