图:信使2018年第3期杂志封面

继互联网引发第三次工业革命之后,以大数据驱动的人工智能技术正在推动第四次工业革命。以下为杨强教授对于人工智能大数据的一些答问与思考:

一问:人工智能与大数据融合是如何兴起的?

杨强人工智能与大数据崛起于21世纪初,当时新兴的搜索引擎Google和百度把人工智能驱动的推荐系统用在广告上,结果发现效果非常好,远远超过预期,而且数据越多,效果越好。但当时没有人意识到在其他领域也是如此。

真正的转折点是ImageNet的兴起。ImageNet是世界上最大的图像识别数据库,其设计初衷是用予视觉对象识别研究。该数据库由美国斯坦福大学和普林斯顿大学的计算机科学家建立,被公认为是深度学习革命的开始。ImageNet大量的图像数据把错识率降低了10%。由此表明,深度学习和大数据的融合可以帮助掌握极其复杂的计算。

二问:您如何定义深度学习与大数据的关系?

杨强:如果人工智能系统设计得好,产品就会更加便于使用、更加精准,因此也更加有用,这样就会带来更多用户。随着用户量的增加,数据也会随之增加,这反过来又会改进人工智能系统。二者是一种互相强化的关系。

大数据和人工智能可以融合成为一种新的人工智能,称作数据智能

三问:您能定义一下什么是大数据思维吗?公司如何才能适应这种思维方式,需要做出哪些改变?

杨强:大数据思维,第一点就是有意识地去收集数据。也就是在开展业务之前,先要想好如何收集数据。

第二,数据收集和核心算法密切相关。要从算法当中了解自己缺少什么,然后有的放矢地去收集数据,包括收集不同来源的数据等。

第三,要形成一个闭环。软件系统提供的服务要能刺激来源产生更多的数据,而这些数据又能够回到系统当中,从而形成闭环。这就使系统能够实现持续的自我改进和自我完善。闭环需要采用特殊设计,它与以往商业所用的设计大不相同。

图:《反思·二》(Reflection #2),巴西艺术家拉克尔·科根(Raquel Kogan)的装置艺术作品,计算机生成的数字投射在漆黑的房间,使观众成为了作品的重要组成部分。

四问:您能否进一步说明什么是人工智能与大数据的闭环设计?

杨强:首先要考虑的是数据提供方,比如用户。所有的用户行为都要以数据的形式记录下来。其次是服务提供方,比如像中国的移动钱包微信支付和中国电商网站淘宝。根据数据生成智能反馈,目的是了解用户的需求。用户将反馈数据提供给服务方,服务方又将服务数据提供给用户,这样就形成了闭环。

要想迅速发展,第一,闭环要足够短,最好不要有人的参与,因为有了人的参与,闭环就无法彻底实现自动化。第二,要经常更新环路,最好一天进行多次更新,因为这样才能确保系统不断得到更新。第三,必须持续进行更新,这样才能促使用户不断提供反馈。所以,这个过程总结下来就是三个字:短、频、快。

人工智能的第二阶段将重塑人类社会,赋予其新的形式。

五问:在您看来,这个闭环实际形成需要多长时间?

杨强:我认为,人工智能发展会分为两个阶段。第一个阶段是所有行业都会去尝试使用人工智能。例如,安保服务会用人脸识别技术,银行部门会用人工智能技术进行风控,等等。这些都是为现有产业服务的独特技术和解决方案。

第二阶段将会出现以人工智能为核心的全新产业。例如,将人工智能作为核心技术的银行,它在投资、服务、信贷等方面可以完全采用人工智能,只有在进行微调时才需要职员。此外,银行也有可能建立全新类型的客服系统。

我认为,第二阶段才是人工智能真正带给人类社会的未来形式。就像互联网刚刚兴起的时候,在第一阶段,传统书店做了一个网页,就认为自己是网上书店了,但事实并非如此。到了第二阶段,亚马逊之类的网站出现了,它们与传统书店完全不同。

六问:大数据和人工智能的结合也可能给信息流通和社会公平带来威胁。如何保障大规模的数据正常流动,而又不侵害个人隐私呢?

杨强:利用大数据和人工智能技术创造出的产品,会带来极佳的新商业模式。但其大规模应用的前提是要确保用户隐私。这里有三点考虑:

首先,我们要有一套法律和社会规则来保护数据的所有权,明确数据在何处可用、在何处不可用。我认为,用户数据应当分门别类。比方说,红区数据不能动,黄区数据只让某些人接触,绿区数据则人人可用。当然,目前对数据的划分还莫衷一是。另外,也没有法律明确阐述责任人的定义,以及违反这些法律会受何处罚。

其次是从技术方面保护数据隐私。比如,第四范式公司(一家总部设在北京的人工智能技术服务提供商)目前正在研究用“迁移学习”来保护隐私,这是一个比较新的领域。它可以协助不同企业彼此交换数据,比如说,A做了一个模型,然后把这个模型迁移到B场景,数据不是在AB之间直接交换,而是被载入了模型之中。这样就可以更好地保护用户隐私。

第三,我们需要深入研究用户隐私和数据定价。比如说,用户通过人工智能推荐系统在网上点击了一个广告,这个推荐系统是不是也应该从中得到一些好处呢?如果搜索引擎有收入,是不是应该分给用户一些?这些问题都值得探讨。

未来几年,人人都会认识到人工智能“落地”的重要性,我们需要更多地关注人工智能如何“落地”,以找到适合应用人工智能的领域。目前来看,金融、互联网和无人车都是比较适合人工智能“落地”的领域。

七问:从全球角度来看,大数据和人工智能相结合会对发展中国家产生什么影响?

杨强:我认为大数据与人工智能技术可以使一些新兴国家赶上、甚至超过传统发达国家。因为在未来,经济竞争不仅仅是比拼金融和经济的规模,更重要的是比拼数据的规模,比拼拥抱数据经济的速度。比如说,中国互联网和移动互联网的迅速发展,使我们得以收集大量数据。这也将加速中国人工智能产业的发展,世界格局可能会因此而改变。

另一方面,一个国家如果已经拥有良好的基础设备和高质量的教育,就可以利用人工智能提高生产效率,就像当年的工业革命一样,蒸汽机的使用让一些国家得到了快速发展。

图:《地下实验室之歌》(Songs of Angura)是一个互动展览项目,旨在介绍关于收集、处理和使用地点和人类行为数据的专门研究领域。

作者介绍:

杨强(中国)人工智能和数据挖掘领域的国际领军人物,国际人工智能联合会(IJCAI)首位华人主席、国际人工智能协会(AAAI)院士、香港科技大学计算机科学及工程学系主任、第四范式联合创始人兼首席科学家。

王超(中国):网易新闻智能工作室记者兼主管,负责报道人工智能领域的重大事件。

关于《信使》:

《教科文组织信使》杂志的创办者和第一位主编、美国记者Sandy Koffler1988年写道:“在所有由联合国及其专门机构出版的期刊当中,《教科文组织信使》一直以其所拥有的巨大的读者群和广泛的受众群而稳居榜首。”自1948年以来,杂志一直伴随着教科文组织的行动。

随着时间的流逝,杂志不管是从内容上还是从形式上都经历了许多变化,但它一直忠于它的第一使命,即:宣传教科文组织的理念,充当文化间对话的平台,组建国际讨论的论坛。

20063月起,《信使》杂志以网络版发行。为了满足全球读者的需要,我们用教科文组织的六种官方语言(英文、阿拉伯文、中文、西班牙文、法文、俄文)以及葡萄牙语、世界语、撒丁语推出了在线版和少量纸张版。

关注网易智能公众号(smartman163),为你解读AI领域大公司大事件,新观点新应用。