数据资产,通常是指数据的存储和计算资源的管理情况,以及维护现有的数据资产,包括我们有什么数据、有什么指标、能做怎样的事情,避免各团队重复开发的事情出现。
数据的存储和计算资源管理,往往是要与运维团队配合,数据集群会给出一份账单数据,研发团队保障成本是可控的,如果预算超支较多,则需要进行治理。
数据资产管理是指对数据资产进行规划、控制和提供的一组活动职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据资产的价值。数据资产管理须充分融合政策、管理、业务、技术和服务,确保数据资产保值增值。
01 什么是数据资产?
数据资产化是企业数字化转型的基石,是把数据原矿提纯为数据金子的必经之路。
那么为了完成从原矿到金子的转变,企业数据应该向什么方向发展以实现数据资产化?以消费者数据资产为例,我们有四个评价指标:
1、标签化
即能通过数据提炼出形象的标签,例如消费者的性别、品牌偏好等。这种标签是概括性的、易懂的,而非绝对值指标。
2、价值化
指已对原始数据进行了清洗、治理、提炼,转化为可衡量的数据,基于这个数据可推导转化为GMV。
3、可应用
做数据看板算不算完成了数据资产化?不算。
数据不止是用来「看」的,而需要面向效果运营,最终可转化为服务并支持变现,为企业带来看得见的效益。例如,把消费者数据运用到广告投放中,提升广告的触达和转化;基于对消费者的偏好数据,对产品研发做下一步的升级等等。
4、可持续
这里指的是数据需要保持新鲜度,并源源不断地注入新的数据,是「活水」。
关于数据存储治理,通常指对数据表进行下线、缩减生命周期等操作。在实际开发过程中,由于长时间的项目积累,我们往往会发现很多不再使用的表仍在在运行,或者是一些不怎么使用的数据,存储的周期非常长,这都是要治理的重点对象。解决的方法也很简单,一是开发前的需求与模型评审,一个是监控数据表或者数据应用的访问情况,对于低频或者无访问的数据,则确认必要性后,进行下线或者缩减生命周期的操作。
关于数据计算治理,则把重心集中在慢SQL的治理上,检查那些消耗资源多、或运行时间长的任务,如果存在数据倾斜则进行优化,如果数据量确实大则考虑极限存储或者进行裁剪,当然最基础的,如对表的暴力扫描这种不合理的临时任务,也是需要及时发现和关闭的。
最后,我们需要整理数据的文档,有能力的团队可以把文档开发成一个录入和查询的平台工具。这个文档或者工具,要解决诸如我们有什么数据、有什么指标、能做怎样的事情的问题。
文档要有如下的几个基本要素:
其一,要有源系统的模型设计,明确业务过程有哪些、业务发生时的数据流向、数据之间的ER关系等信息;
其二,要有指标字典,指标字典是非常重要的,一定要在需求沟通的过程中沉淀下来,当我们回头去看的时候,大量的时间在沟通指标和维度的定义;
其三,要有开发和需求规范,很多时候我们处于效率的考量,会做很多“私下”的工作,但这些工作往往不在正式的列表中,因此流程上还是要规范一些,不要把有限时间放到无限的沟通中去。
如何实践数据资产管理
数据作为越来越重要的生产要素,将成为比土地、石油、煤矿等更为核心的生产资源,如何加工利用数据,释放数据价值,实现企业的数字化转型,是各行业和企业面临的重要课题,然而数据的价值发挥面临重重困难。企业的数据资源散落在多个业务系统中,企业主和业务人员无法及时感知到数据的分布与更新情况,也无法进一步开展对数据加工工作。数据标准不统一,数据孤岛普遍存在导致业务系统之间的数据无法共享,资源利用率降低,降低了数据的可得性。标准缺失、数据录入不规范导致数据质量差,垃圾数据增多,数据不可用。数据安全意识不够、安全防护不足导致了数据泄露事件频发,危害了企业经营和用户利益。为了解决解决数据面临的诸多问题,充分释放数据价值。
当前企业数据资产全生命周期管理存在一些问题,比如数据组织方面,很多企业也缺乏专业的数据资产管理组织;数据管控流程方面,跨域跨专业数据管控流程尚未建立、跨域数据管理技术手段尚不完善;IT架构方面,采用烟囱式的传统IT架构,使得企业在进行数据资产管理时会遇到数据分散、规模大、种类多、质量差的问题,导致了数据变现的困难。同时在数据安全方面,很多企业没有进行数据密级的控制,使企业在做数据分享时会遇到不知道该不该给、该给多少的问题,存在数据安全问题。
这里亿信华辰旗下的数据资产管理平台(EsDataAssets)通过元数据对信息资产特征进行描述,并以目录形式分类管理,形成统一的目录内容和数据资产服务,丰富的服务接口的拓展,支撑数据资产的多渠道应用,如数据共享服务、分析决策支持等,最终实现数据资产价值最大化。
热门跟贴