凌晨两点,一位数据科学家仍在刷新Kaggle排行榜。她的模型精度提升了0.3%,却离解决客户真正的库存积压问题越来越远。

从分数竞赛到问题追踪

打开网易新闻 查看精彩图片

拉杰什坎纳(Rajeshkanna)在Medium发文讲述这个转变:当团队停止追逐公开数据集的排名,转而深入仓库实地观察缺货与滞销的悖论时,他们发现算法优化的方向完全错了。

打开网易新闻 查看精彩图片

精度指标(Accuracy)在干净的数据集上漂亮,却解释不了为什么预测准确的商品反而堆积在角落。真正的问题藏在标注数据之外——季节性波动、供应商延迟、门店陈列空间。

为什么聪明人困在错误游戏里

公开排行榜提供即时反馈和社交货币,形成强大的行为陷阱。拉杰什坎纳观察到:工程师倾向于优化可量化的指标,而非 messy 的真实业务场景。

这种错位并非技术能力不足,而是激励机制设计的结果。竞赛排名与商业结果脱钩,导致资源错配。

打开网易新闻 查看精彩图片

重新校准的代价与收益

她的团队花了三个月重建评估框架,将预测准确率与客户实际周转率挂钩。初期模型分数下降,但库存成本削减了23%。

关键转变在于定义问题的权力从平台算法回归到一线决策者。

数据收束:0.3%的精度提升 vs 23%的成本削减——同一批工程师,换一个问题定义方式。