原标题:我们正站在数据的悬崖上

近日,“连衣裙”惹出一场来去倏忽的小风波。

微博网友“风中的厂长”表示,电商行业找女朋友有一个“铁律”:淘宝好评率低于98%、滴滴好评率低于4.8、搜索连衣裙客单价低于128元——满足这三条的人不能找,因为“难伺候”。其中连衣裙这条让许多人不解,他解释道:“这个消费区间的人群,被淘宝系统打上低价人群标签,经过分析各种行为后,做成了大数据。”

我循着指南去淘宝搜了一下“连衣裙”,发现系统推荐给我的都是几千块的。正为自己被系统定义为“有钱人”高兴之余,却看到了淘宝的辟谣——“压根不存在128元这条线”。淘宝负责算法的小二解释道,个性化推荐的初衷是满足用户多样化和实时变动的需求。

这也许是一则乌龙消息,但牵动了人们绷紧已久的一根神经,所以才会引起喧哗。关于大数据,关于隐私,关于未来社会的模样。“每个人都有自己的价格”,曾经这只是一个粗略的比喻,如今在大数据的帮助下,则可以精确到一分一厘。哪怕128元的连衣裙这条线不存在,电商网站的服务器上也一定给每个用户都画了一幅异常精细的数字肖像,价格敏感度只是其中一个维度。

我们本不该感到惊讶。当互联网公司在谈论人工智能、大数据乃至毫不忌讳地谈论用户画像的时候,围在边上吃瓜的人意识不到自己已沦为数据砧板上的一块肉。

当然,这些互联网公司会脱口而出“都是为你好”,就像一些家长对孩子说话一样。抖音推荐的视频都是你爱看的,网易云音乐推荐的歌曲都是你爱听的,电商推荐的商品都是你刚搜过的,好像确实不错。

但“美丽新世界”还有另一面。2018年,“大数据杀熟”进入公众的视野。许多网友发现,同样的商品或服务,老客户看到的价格反而比新客户要贵。虽然被指控的公司都发表了否认声明,但人们纷纷以自身经历证明传言非虚。

价格歧视是商业世界中存在已久的现象,并非所有的价格歧视都是不合理的,比如便利店的矿泉水就是比超市贵,但消费者愿意为了少跑腿而多花钱。不过,价格歧视一旦捆绑上大数据这个“火箭”,便会产生质变式的惊人威力,消费者也就难以淡定了。

当前的大数据是一个一仆二主式的游戏,数据有两个效忠对象:一个是互联网公司,一个是用户。数据是用户的行为产生的,理论上用户应该对自己的数据拥有掌控权。但实际上,哪些数据被收集,数据存于何处,数据何种用途,这些关键问题用户一无所知。所以就产生了“管家”取代“主人”的局面。

大数据的黑箱状态除了造成反噬其主的忧虑,还产生数据交叉混用的风险。电商、网约车上的数据如果被用于相亲,可能还真有效,比如一个喜欢给卖家打差评的买家有很大概率在生活中是不易相处的人,但这么做合适吗?

数据科学家赛思·斯蒂芬斯-达维多维茨在《人人都在说谎》一书中提出了类似的问题:企业是否有权根据与其提供的服务不直接相关的抽象统计学预测标准来判断人们是否可以享受其服务呢?

《人人都在说谎》书中还有一个例子:剑桥大学和微软的研究人员发现,脸谱网的点赞常常与智商、外向的性格和责任心相关。例如,脸谱网上喜欢莫扎特、雷雨天气和卷曲薯条的人往往智商较高。喜欢哈雷摩托的人往往智商较低。如果有企业利用这个规律,在招聘时把“喜欢哈雷”当成排除项,显然是不公平的。但有什么手段能确保企业拒绝此类诱惑呢?

现在的问题在于,大数据在技术层面突飞猛进的时候,其在伦理与合法性上的隐患却没有得到充分的重视与讨论。我们正站在数据的悬崖上,请记住,下面不一定是世外桃源。

(作者系资深媒体人)

作者:西坡