原标题:专访微软小冰负责人:预测奥斯卡是一种怎样的体验

摘要:微软小冰背后的必应搜索是如何进行包括奥斯卡、超级碗、总统大选在内的一系列预测的?这种预测和竞争对手的最大不同在哪?做预测的技术和经验又将怎样影响我们的工作和生活?cnBeta 专访微软小冰资深产品总监彭爽,讲述预测奥斯卡背后的故事。

2016年奥斯卡结果已经出炉,给了大家一个期待已久的惊喜。已经陪跑多年的莱昂纳多·迪卡普里奥终于如愿捧回了最佳男演员的小金人。这结果已经在宣布前被多个人工智能产品成功预测,其中就包括微软的必应搜索。在中国,是采用必应技术支持的人工智能机器人小冰宣布了预测结果。昨日 cnBeta 对微软小冰资深产品总监彭爽进行了电话采访。

如何预测?

2016年是微软小冰和必应搜索第二次公开发布奥斯卡奖项的预测。彭爽表示,在作出两次公开预测之前,必应团队也结合之前多次奥斯卡奖评选的结果进行了模拟测验。在模拟测验结束之后,又把这些结果统一的放进预测模型当中进行机器学习。

这两次预测结果,在中国以外的其他地区是由必应直接发布了“Bing Predict”页面,而在中国则是由人工智能机器人小冰来担当播报员。那么给小冰的运算能力,是否有一部分也用在了预测方面呢?对于这一点彭爽解释说,小冰实际上是对必应的搜索结果活用的一个人工智能的交互界面,所有小冰直接应用的计算能力和算法,都是要解决人机交互方面的问题;而她的“智慧”则还是依赖于必应搜索的全网大数据。所以使用必应搜索结果进行预测,也就是在动用小冰的“大脑”。

虽然现在微软(亚洲)互联网工程院因为小娜、小冰有关的工作为外界所知,但是在2011年成立之初,必应搜索引擎及其前身Live搜索已经是这个工程院连续数年攻关的内容。这些积累也使得他们在相对短暂的时间之内,就打造出了小冰这个成功的产品。“因为预测的概念跟人工智能的概念更近,所以我们选择让小冰来发布这个结果的时候,会让用户觉得接受度更高,听起来也更有意思。所以小冰会说出预测结果,而不是代言所有的搜索产品。”彭爽说。

有何优势?

必应搜索以往曾经有过大致3类预测:奥斯卡、金球、格莱美等专家评选类项目的预测,奥运会、超级碗等体育赛事的预测,以及选举、公投等政治活动预测。这3种不同的预测有着各自不同的鲜明特征,因此是不能一概而论的。相对而言,奥斯卡这样的专家评审更加依赖少数专业人士的意见,而政治活动则依赖民意,导致同样的搜索指标占有不同的权重。所以,虽然用的是类似的预测模型和技术,但是不同类型的预测准确度肯定会不一致。

比如说,在过去一个月中相继进行的金球奖和英国电影学院奖,都被业界视作奥斯卡风向标。必应团队提升了此类奖项结果的权重,相应降低了全网搜索结果的权重。彭爽说:“在这些由专家评审而不是民意决定的奖项当中,从搜索结果来看会有一个直观的热度排名,而热度排名和评选结果往往并不一致。”莱昂纳多对奥斯卡奖,村上春树对诺贝尔文学奖,凯蒂·佩里对格莱美奖都竞逐多年,每次预测时都需要考虑到网络搜索热度的干扰因素,并且适当的排除干扰。

同样,也正是因为奥斯卡具有专家评审的特征,这也导致一些以少数专家思维抽样做人工智能分析的预测,能够在本次取得比较高的准确率,其中比较出名的一个就是Unanimous A.I.,cnBeta之前也有过报道。不过彭爽认为,必应依托全网搜索大数据得出的结果,和几位专家智慧的结果达到同样的准确度,恰好能够证明预测技术的成功,因为很显然抽样更多的预测结果会更健壮。“当预测选择的样本数量越多的时候,就越会杜绝其中某一位评委或专家个人因素而导致的波动或者扰动,使得整个结果更加稳定。”在专家评选的预测当中,人工智能式预测可以调用给定专家的思维,但是如果遇到需要检测全民意志的活动,就只能够采取抽样调查的方式,那么如何抽样将会成为另外一个棘手的问题。

怎样应用?

目前为止必应进行的预测,绝大部分都是面对美国市场。其中虽然搞了一个关于苏格兰公投结果的预测,但是苏格兰公投很显然也是那一段时间美国人最为关心的话题之一。所以是否会针对中国区或者是大中华区进行一些预测呢?特别是,当香港特首及立法会选举,台湾地区领导人及民意代表选举都如火如荼的时候,必应会否把此前大规模选举预测的成功经验介绍到华语地区呢?彭爽表示暂时不会有涉足这方面的计划。但是对于华语地区的用户来说,肯定会有适合他们的预测项目,“比如说体育比赛的预测基本就是无国界的。”当我们谈到必应将如何进行2016年里约奥运会预测的时候,彭爽希望我们“卖个关子”,到时会有具体的细节提供。

在美国市场,必应提供了一个名叫Cortana Analytics的分析技术,是把在全球市场已经推行的微软小娜的一些应用场景分拆之后,交给企业租用来分析内部大数据。在中国区,因为有小冰这个目前由中国和日本独占的产品,所以关于人工智能的商业化,最早也是针对小冰来展开的。

我们之前报道过微软已经针对一些微信公众号,开放了小冰的合作权限。只要接入小冰之后,她就可以成为一个24小时不休息的客服助理,在人们直接给公众号留言的时候激活,进行智能回复。彭爽表示,鉴于隐私问题,用户在公众号当中与小冰互动的具体信息,企业是无法完全得知的。但是企业会收到由必应整理之后的报告,这份报告会去除所有能够识别个人身份的信息,而汇总出用户的性别、年龄和更多偏好作为企业的决策依据。

彭爽说,“企业往往只知道销售端把产品卖到消费者那里为止的一些情况,但是对于消费者使用产品之后的感受,以及他们本人的喜好,却没有什么途径去了解。”在这方面,小冰收集到的用户反馈数据可以起到一定作用,只是现在尚不能完全替代专业的分析师和咨询机构的工作。