八年前,企业搞数据仓库就像整理一个乱到无从下手的巨型车库。是先把所有东西搬出来,定制一整面墙的货架,给每颗螺丝钉编上永久编号?还是只收拾当下要用的角落,春天整园艺工具,冬天再管雪铲?
这两种思路至今仍在撕裂数据工程圈。前者叫Inmon派,主张"自上而下";后者叫Kimball派,信奉"自下而上"。如果你的公司正打算建数据仓库,这两个名字你绕不开。
打开网易新闻 查看精彩图片
Inmon:先建"中央厨房",再分"档口"
Bill Inmon被尊为数据仓库之父。他的核心信条是:数据仓库必须是企业唯一的、终极的真相来源。
操作上,Inmon采用顶层设计。你得先摸清全公司所有系统——销售、人力、财务——把数据全抽出来清洗,塞进一个巨型中央数据库。这要求业务需求必须前置定义,企业级的数据需求得完全厘清才能动工。
治理是硬约束。数据质量、安全、标准化,全由中央严格管控。结构采用规范化存储,杜绝冗余。客户改名?只改一处。
中央仓库建成后,再从中切出小块"数据集市"(Data Marts)给各部门用。每个部门有自己的集市,但数据源头严格锁定在中央仓库。
流程图很清晰:源系统 → ETL → 数据仓库 → 数据集市 → 报表。
好处显而易见:单一真相源,各部门数字不会打架;高度一致性,指标定义全企业通用;大型组织扛得住,架构够重够稳。
热门跟贴