大数据时代——“数据挖掘”商机显现 “数据割据”仍是最大擎肘

新华网广州11月19日专电(记者 付航)“一找照妖镜”,最近这款应用在微博上火了起来。网民在该应用中输入任意微博用户名,就能查询到该用户的“真粉率”。网民们纷纷晒出一些大V的真粉率,加以调侃。

公司创始人徐亚波介绍,这款应用是通过微博接口抓取大量数据,在综合分析基础上形成了一个僵尸粉评定系统,并建立僵尸微博账号数据库。用户输入账号名后,系统将其粉丝与僵尸微博账户数据库进行比对,就可以迅速生成其真粉率。

这款应用是当前大数据时代掘金的成功案例之一。徐亚波透露,除“一找照妖镜”这类公众服务外,其公司还用数据挖掘技术向企业提供客户精准定位、产品品牌分析等服务,企业客户数量达三四千家,去年开始已经实现盈利。

由于信息生成、存储和分享日益便捷,IDC预计,到2020年,世界上的数据存储总量将达35ZB(1ZB等于1万亿GB)。有越来越多公司投入到大数据的分析和商机的挖掘。 谷歌公司通过对搜索数据的分析能预测流感的暴发时间、地域。美国联邦政府的统一数据开放门户网站催生了一项免费的航班延误分析应用,显著降低了航班延误率。

国内,一个被业界反复提及的案例是北京朝阳大悦城通过大数据提升消费者体验。大悦城有专门的信息部,在商场的不同位置安装将近200个客流监控设备,通过分析客流走向改善商户推广手段,对车流的数据分析带动了停车场的改造,以吸引优质的有车客流。

这些只是大数据展现潜力的开始。业内人士认为,如果结合物联网的发展,使人与人的数据扩充到人与物、物与物,大数据还将再上一个台阶。

“很明显感觉整个大数据产业是在上升势头。”徐亚波说。虽然产业界限和分工还不明晰,智梦创科等大量初创企业涌现,一些在传统行业从事数据挖掘的企业也转型进入大数据。

将手头的巨量数据转化成盈利,这个前景让各行各业都开始心动。但业内人士担心,“数据割据”的现实恐怕让这个前景蒙上阴影。

互联网大公司都掌握有部分消费者数据,其中,百度、腾讯、阿里巴巴集团三大互联网巨头分别掌握搜索、社交和消费数据。三方数据的汇总将拼凑出一个完整的网上信息图谱。可惜的是,三方并无体现数据合作意愿,淘宝和腾讯微博先后屏蔽百度的蜘蛛爬虫。

“互联网巨头都是封建割据思维,没有认识到信息的流动才是互联网的精髓。”长期关注大数据的知名IT经理人王冠雄表示,这些巨头认识到数据将是未来发展的战略性资产,不会轻易拱手让人。“数据割据”造成大数据缺乏完整性和一致性,可利用价值大打折扣。

尤其对于处于大数据中下游的企业来说,如果缺乏数据源头的支持,将“巧妇难为无米之炊”。几位接受采访的业内人士抱怨,目前虽然各大巨头都嚷着要开放,其实是“挂羊头、卖狗肉”,没有真心诚意将数据源开放,或者只允许在其各自平台上运行。

至于实体社会中的个体信息,更是封闭在工商部门、银行、保险、公安、医院、社保、运营商等机构手中,难以看到融合的曙光。这也是为什么除了以上两例外,国内成功的案例其实寥寥。

当然,将所有数据熔于一炉,固然是巨大商机,但要遭遇巨大的伦理挑战。如《大数据》作者涂子沛例举的美国高院一项判例表示,“在一个有组织的社会里,几乎每一则信息都在不同的时候以不同的形式公开过。但是,就个人隐私而言,不同时期零散地公开和一次性完整地公开,即使内容相同,也有本质的区别。”试想,若商业组织或者政府真把民众的所有信息掌握在手,个体等若纤毛毕现,恐怕也是一件令人毛骨悚然的事情。(完)

(原标题:"数据挖掘"商机显现 "数据割据"仍是最大擎肘)