我认识一个做反欺诈的工程师。她说过一件事:团队曾经特别骄傲,因为仪表盘几乎永远是绿的。好几个月,没有一个高级别警报触发。
后来她才明白,没警报不等于没欺诈。只是欺诈转移了——变成了她的检测器"看不见"的那种。
打开网易新闻 查看精彩图片
AI智能体的仪表盘,正在重演这个故事。
2026年,典型的智能体仪表盘长这样:成功率98.7%,P95延迟3.2秒,单次成本4美分。箭头朝上,CFO点头。这是"友好峰"——真实存在,但不是全部。
真正的 payoff 分布是另一幅图:右边的小峰是仪表盘能看到的,频繁的小赢。均值是正的,汇报很漂亮。但左边拖着一条又长又丑的尾巴,最边缘还有一个 spike——周二下午,负两百万美元,直接冲出图表。
大多数日子,智能体帮你省钱。一年里有一天,它做了不可逆的事。
均值捕捉不到这个。方差、标准差、三西格玛置信区间,全都捕捉不到。它们默认世界是对称的。智能体世界不是对称的:上限锁死(每天最多省200块),下限没有(一个下午能删掉一张表、发错一笔电汇,损失200万)。
统计学家叫这"肥尾分布"。科技业三十年都在为友好峰设计。撞上这种风险形状,注定难看。
一个免费结论:任何把智能体表现汇总成单一数字的KPI,结构上就在撒谎。不是因为做仪表盘的人不诚实——他们大多很优秀——而是因为数学本身不允许。肥尾分布无法归约为一个数。
仪表盘是绿的。欺诈在别处发生。
热门跟贴