企业如何进行数据治理,会采用不同的方法和路径。

打开网易新闻 查看精彩图片

总体而言,第一步对企业数据进行归集和标准化。

信息化领域有一个说法就是“垃圾进,垃圾出”,意指用脏乱的数据做样本,产生的研究成果也是毫无价值的。数据的污染可能发生在数据产生、采集、传输、流转、加工、存储、提取、交换等各个环节,因此要保证数据治理目标的实现,就必须对数据进行全流程的管控,要在数据标准、数据质量、数据文件交换、元数据、数据生命周期、主辅数据源、数据安全、数据责任等方面形成统一的数据治理规范。

第二步就是数据模型管理和标签梳理。

除此之外,数据标签是对数据实体特征的符号表示,每一个数据标签都是我们认识、观察和描述数据实体的一个角度。因此内部统一标签也至关重要。商品标签包含了条码、规格、口味、图片、包装等信息。顾客标签包括性别、年龄、地区、兴趣爱好、产品偏好、购买力、忠诚度等等。

在实际的数据治理中,数据资源目录、数据分类、数据标签是相互配合、相辅相成的。建立良好的数据资源目录的第一步就是明确数据资源的分类,根据数据分类去组织资源、编目,之后是为数据资源打上数据标签,让数据资源更贴近用户、更容易管理,以便充分发挥出数据的价值。

第三步是企业算法和人工智能应用。

在对企业数据进行归集和标准化,并对数据模型进行管控和标签梳理之后,就可以对数据进行管理,并辅之以相应算法和人工智能,在具体业务场景应用。

以数据模型管理为例:人工智能可以帮助企业实现经验模型与计算机模型的完美融合,构建商品和会员的知识图谱。

元数据管理为例:人工智能实现对非结构化数据的采集和关键信息的提取,并实现元数据的维护和整理。

再以主数据管理为例:主数据是企业核心业务实体的数据,是在整个价值链上被重复、共享应用与多个业务流程的,并与各个业务部门与各个系统之间共享的基础数据。在复杂数据主数据系统中,机器学习,自然语言处理等人工智能技术可以帮助定义和维护数据匹配规则,以及确定与主数据相关的记录,建立交叉引用等规则。

新基建在某种程度上已经成为国家战略,可以预见,未来几年,全国零售业将迎来一次数字化建设的高潮,借助零售新基建的落地,我们期待业内零售企业快速提升数据管理和应用能力,让中国的零售行业变成一个高效的行业,更好的为消费者服务。

睿治是全国唯一实现了数据治理场景全覆盖的突破性产品,元数据、数据标准、数据质量、主数据、数据资产、数据安全、数据交换、数据处理、数据生命周期等九大核心模块,以创新的方式保证了企业的业务数据在采集、汇总、转换、存储、应用整个过程中的完整性、准确性、一致性和时效性,全面为客户量身打造符合自身特征的数据治理体系,实现数据资产管理和数据价值的挖掘。通过“平台化、可视化、智能化”的方式提升企业数据治理工作效率,真正降低成本。

打开网易新闻 查看精彩图片

睿治在产品功能方面,针对不同客户场景,研发了多种特色功能:

  • 元数据管理:实现了多种源头全自动化元数据采集、字段级元数据分析、数据关系自动解析,并通过全局数据地图,系统关系一目了然;

  • 数据标准管理:可以对标准属性灵活配置、规范标准管理流程、标准落地智能映射、定时自动落地评估、多维度统计监控等保证标准的有效落地;

  • 数据质量管理:内置十多种成熟规则、质量问题智能探查、质量报告自动生成、整改流程自主定义,再配以绩效考核体系,帮助构建质量闭环;

  • 数据集成管理:实现可视化数据建模,并内置150+数据加工组件,这些组件均为自行开发,全面提升数据集成的效率;

  • 主数据管理:实现主数据智能识别、精准匹配、多种更新策略实现主数据高效获取与分发,保证企业用到真正统一的、准确的黄金数据;

  • 数据交换管理:可以对接多种异构系统,其中就包括不少国产数据库,并可自定义多种调度场景,满足各类数据传输处理的需要;

  • 数据资产管理:可以针对不同视角进行资产编目,智能目录活化更新技术,一键实现资产共享,将数据资产的价值最大化释放;

  • 数据安全管理:可以对敏感数据进行分级管理、智能识别、访问行为监控,并对重要数据快速脱敏、加密,全方位保障数据安全;

  • 数据生命周期:可以根据数据价值,自定义归档、销毁策略,自动进行归档任务执行,有效的提升数据管理效能。