亚马逊推荐算法翻车3年，张量运算终于把它捞上岸|亚马逊公司|张量|知名企业|算法

2023年，亚马逊电商团队发现一个尴尬的数据：用户搜索"防水蓝牙音箱"，前10个结果里有4个是不防水的普通音箱，2个是耳机，还有1个是音箱保护套。推荐系统的精准度正在以每年12%的速度下滑，而修复成本已经烧掉2.7亿美元。

这不是算法不够聪明，是数学工具选错了。

张量：把压扁的世界还原成立体

张量（tensor）不是什么新发明。物理学家用它描述应力分布，气象学家用它存全球气温场。但在推荐系统里，它直到最近才被认真对待。

简单说，张量是矩阵的N维推广。矩阵是二维表格，张量可以是三维立方体、四维超立方体，或者更高。在推荐场景里，它允许你同时建模：用户×商品×场景×时间×位置×设备。

一个具体例子：外卖平台的午餐推荐。

矩阵时代，系统知道"用户A喜欢川菜"。张量时代，系统知道"用户A在工作日午餐时段、用公司电脑、距离送达时间小于30分钟时，对川菜的偏好度是0.73；但在周末晚餐、用手机、不赶时间时，偏好度降到0.31"。

这个差异不是微调，是质变。DoorDash 在2023年部署张量分解模型后，午餐时段的点击率提升19%，而晚餐时段反而下降4%——系统终于学会了"分场景说话"，而不是全天推送同一套结果。

技术实现上，核心是张量分解（tensor decomposition）。把庞大的多维数据压缩成几个"因子矩阵"，既保留维度间的交互关系，又能快速计算。Google 在2015年提出的 Tensor-Train 格式，让万亿参数的张量也能在单机上训练。

从实验室到购物车：三家公司的实战

阿里妈妈在2024年双11前全量上线了张量召回模型。他们的技术负责人王睿在闭门会上提到一个细节：女装类目里，"用户最近浏览"和"用户历史购买"在传统模型里是互相打架的两个特征——浏览多了，系统怕你不买；买多了，系统怕你不逛。张量模型把它们放进不同维度，发现"浏览但未购买"和"购买且复购"其实是两种完全不同的用户状态，应该走两条召回通道。

结果很直接。女装类目的曝光转化率从1.2%提升到1.7%，听起来 modest，但乘以双11期间87亿次曝光，是多出4.35亿次有效点击。

Spotify 的路径更曲折。他们的音乐推荐长期用矩阵分解，2022年尝试引入张量建模"听歌时段×心情标签×社交分享"三维交互，但训练成本暴涨8倍，上线两周后 rollback。真正的突破来自稀疏张量格式——只存非零元素，把存储量砍掉两个数量级。2024年重新上线后，"每日推荐"的完播率提升11%，用户主动收藏率提升23%。

亚马逊的修复方案最保守，也最说明问题。他们没有推翻整个系统，而是在搜索排序层插入一个张量重排模块，专门处理"多意图查询"——比如"苹果"，可能是水果、手机、唱片公司或纽约地标。张量模型同时计算四个意图的置信度，再和商品的多标签嵌入做交互。2024年Q3的数据显示，这类查询的满意度评分从3.2提升到4.1（5分制）。