谈及企业数据的核心与灵魂,便不得不引出“主数据”这一关键概念。本文将带您揭开主数据的面纱,探讨其在企业数据中的地位,辨析主数据与参考数据、数据标准的微妙差异,并阐述数据标准、数据质量与主数据的相互关联。通过生动形象的类比,我们期望能够为您搭建起一座理解主数据及其相关知识的桥梁。
什么是主数据
主数据,作为企业核心业务的关键信息单一来源,支撑着企业的关键业务流程与事务。这一表述强调了主数据在企业运营中的核心与重要性,将其视为企业的“黄金数据”。
具体而言,主数据是描述企业核心业务的主体,主要有资产、地点、客户、供应商以及产品等。这些主数据共同具备四个显著特性:唯一性、共享性、稳定性与有效性。
为了更直观地理解这些特性,我们可以对比一些非主数据。以订单为例,虽然每个微信订单号都是唯一的,且在一定程度上具有共享性(即在订单从产生到结束的整个流程中),但其生命周期相对较短,且其共享范围也仅限于该流程内部。此外,尽管订单会被多个系统使用,但其稳定性与长期有效性并不如主数据。订单的有效性仅限于其生命周期内,而不像产品那样会在多个系统中长期稳定地使用。
因此,像订单这类信息,由于其不具备主数据的全部特性,我们一般不将其列为主数据的范畴。这一判断标准有助于我们更清晰地界定主数据与非主数据的界限,从而更好地进行数据管理与利用。
企业数据范围
企业数据的范畴广泛,包括交易数据、主数据、分析数据、IOT物联网数据等。在此,小亿大致将企业相关数据划分为企业外部数据和企业内部数据两大类进行详细阐述。其中,物联网数据是一个既涵盖企业内部又涉及企业外部的重要领域。
就企业内部而言,首先企业的核心关键数据,即主数据。进一步扩展,则涵盖了企业日常的经营数据,如采购数据、销售数据、生产数据等。基于这些经营数据和主数据,我们可以进一步生成企业内部所需的分析数据,这些数据主要是通过生产经营的加工汇总得出的,包括业绩统计、关键KPI指标、财务报表以及决策支持数据等,它们共同构成了企业内部的关键数据体系。此外,企业还会涉及传感器、设备、仪表等相关数据,以及日志数据和监控数据等,这些都属于物联网数据的范畴。
另一方面,企业外部数据主要涉及两大板块。首先是与企业有一定联系的相关数据,如友商数据、电商数据、银行贷款数据以及工商、税务、法院等涉及企业的数据。这些数据虽然与企业有一定的距离,但仍然是企业运营中不可或缺的信息来源。
再往上,则可能涉及一些更为社会化的数据,如社交媒体数据(包括微信等社交平台的数据)、政府公开的政策法规数据等。这些数据看似与企业距离较远,但实际上,它们同样对企业的运营产生着重要影响。例如,政策法规的变化可能直接影响企业的经营策略,而社交媒体数据则能反映出消费者的需求和偏好,为企业的市场营销提供有力支持。
从重要性而言,企业数据的价值挖掘和利用是一个从内到外的过程。首先,我们需要做好组织内部的数据管理和分析工作,提升组织力。然后,逐步向外扩展,将外部数据纳入企业的数据体系中,为企业的经营决策提供更为全面和准确的信息支持。这样,企业数据才能真正发挥其价值,为企业的持续发展提供有力保障。
容易混淆的3个概念
接下来,小亿将阐述几个容易混淆的概念:参考数据、主数据以及数据标准。
之所以将这三个概念放在一起讨论,是因为它们在数据治理理论中紧密相连,比如参考数据和主数据在DAMABOK中是同一章节,而主数据和数据标准在实际项目中则常常引发人们的困惑。例如,人们可能会疑问:建立了主数据体系后,是否还需要制定数据标准?反之亦然。这两者之间到底有多少交集,又有多少不重叠的部分?它们各自在哪些领域更为擅长,能在数据治理的哪个环节提供不同的解决思路或解决不同的问题?
为了解答这些疑问,将对这三个概念进行详细讲解。
1.参考数据
参考数据管理的是对定义的数据域中关联的数据值进行管理,包括标准化术语、代码值、唯一标识符,以及其他数据取值所需的业务定义等。
简单来说就是我们日常所说的码表或维度,如邮编、地区、性别、学历等。这些参考数据相对固定,无论是维度的编码规范还是命名方式,无论是国家标准还是行业标准,都遵循一定的标准。它们已经具备了宏观和微观的参考面,形成了具有参考价值的数据。
2.主数据
企业主数据是指企业内部一致共享的业务主体。主数据则更多地关注数据的源头管理,它不仅仅局限于软件层面,而是对数据本身进行源头上的管理和控制。
3.数据标准
至于数据标准,它实际上是对数据过程的管理。与主数据相比,数据标准在本质上存在区别。数据标准更注重数据在流转过程中的规范性、一致性和准确性,以确保数据在整个生命周期内都能保持高质量。对于主数据而言,也有主数据的数据标准,数据标准不仅确保了数据在采集、存储、处理和传递过程中的高质量,还为主数据的源头管理提供了规范和指导。
主数据与数据标准是相互关联、相辅相成的。数据标准为主数据的源头管理提供了规范和指导,而主数据的源头管理则确保了数据在整个生命周期内的高质量。通过制定和实施主数据的数据标准,企业可以更好地管理和利用主数据,支持企业的决策和业务发展。
一个类比阐述区别
下面,我将通过举例和形象类比的方式,重点阐述主数据和数据标准的区别。由于参考数据相对容易理解,因此在此不再赘述。
首先,我们来看一个日常数据仓库(DW)三层建设的标准流程(如上图),这一流程大家应该较为熟悉。而主数据的应用路径则有所不同,它并未进入数据仓库,而是直接从业务系统的源头对数据进行处理和管控。相比之下,数据标准则是在数据从生产环节产生后进入数据仓库或数据湖的过程中,对数据流转加工进行监督和落标管理。
为了更形象地说明这一点,举了一个可能不太恰当的例子,但相信能够帮助大家理解。主数据就像交警,而数据标准则像协警。交警主要出现在关键和主要的路口,拥有执法权和处罚权,负责维护交通秩序和制定交通法规。而协警则出现在各个路口,协助管理交通,但没有执法权,只能配合交警处理相关事务。
在这个类比中,主数据就像交警一样,在数据流程的关键环节进行管控和治理,确保数据的准确性和一致性。而数据标准则像协警一样,在数据流转的过程中提供监督和指导,确保数据符合既定的标准和规范。
此外,还想穿插一个与主数据、数据标准紧密相关的概念,那就是数据质量。数据质量可以类比为查酒驾的执法人员,他们不仅查酒驾,还可以查毒驾、违章、超速等。在数据流转的各个环节中,数据质量负责检查数据的准确性和合规性,确保数据符合既定的质量规则。
因此,主数据、数据标准和数据质量这三者紧密相连,共同构成了数据治理的核心。它们既可以作为整个数据治理过程的重要组成部分,也可以结合使用,对数据的质量进行全方位的把控和提升。
热门跟贴