不知不觉间,我们的生活中已经充满了数据,各种岗位例如运营、市场、营销上也都喜欢在职位要求加上一条利用数据、亦或是懂得数据分析。事实上,数据已经成为了构建现代社会的基本生产要素,并且因为不受自然环境的限制,已经成为了人们对未来社会发展方向的共识。也正是这些,所以数据仓库的讨论的开始逐步增加。

近几年的时间里,因为自助BI、敏捷BI的兴起,很多企业在部署商业智能BI的时候,经常会询问是否需要建设数据仓库,一时间数据仓库成为了商业智能BI中的负面影响源头。其实这主要是因为很多人不太明白数据仓库到底在商业智能BI项目中发挥了什么作用,所以引发了很多争论。

在讨论数据仓库前,我有一个问题,有数据仓库的话,商业智能BI就不能自助分析、不能敏捷开发了吗?商业智能BI的数据仓库听起来和数据库也差不多,是不是换了个名头?数据仓库中备受重视的维度、指标又是什么,对于企业有何意义?下面我们带着问题浅谈下商业智能BI数据仓库。

数据仓库是什么

事实上,很多人在看到数据仓库的第一眼,就把数据仓库当成了数据库。当然这也很正常,毕竟从名字来看这两者确实区别不大,真正区分两者的是定位、作用等更深一层的东西。不过在这里还是先解释数据仓库的概念,不同之处后边会进行详细讲解。

数据仓库是一个面向主题的、集成的、随时间变化但信息本身相对稳定的数据集合,用于支持管理决策过程。其本质就是完成从面向业务过程数据的组织管理到面向业务分析数据的组织和管理的转变过程,也是商业智能BI中数据仓库的主要作用。

打开网易新闻 查看精彩图片

数据仓库 - 派可数据商业智能BI可视化分析平台

数据仓库就像企业的总的大仓库,能够存储不同来源、不同格式的数据,并且可以通过ETL和数据模型,对数据进行高质量的筛选,分级分类进行存储。具有很强的稳定性,不会频繁的进行增删改等操作,能够反应历史变化。

用通俗的话来说就是数据仓库就像一个终端的大仓库,其他小仓库的各种货品会通过各种方式统一存储到这里,然后通过仓库位置的划分、货品的摆放进行归纳分类,实现规范、标准的从存放,到分类,再到使用的完整过程。

数据仓库和数据库有什么不同

其实数据仓库和数据库跟现实中的仓储系统是有很多相似之处的,企业各部门的数据库就相当于一个个小的产业库,对应了企业的各个部门。而数据仓库相当于是一个终端仓库,其中存储的物品是由各个小的仓库运送的,是各个数据库的集合体,一个更大的综合数据库。

打开网易新闻 查看精彩图片

业务数据 - 派可数据商业智能BI可视化分析平台

此外,数据库和数据仓库最不同的还是服务对象和作用。上边也提到了,数据库基本上是服务于各个部门,是业务信息系统的附属品,也就是我们常在信息化建设初期中提到的ERP、OA、CRM等业务系统。这些数据库是服务于各种业务系统以及业务软件,主要是通过业务流程发挥作用。

而数据仓库就不一样了,它不是服务于业务信息化系统的,它是服务于分析型应用的。更多的是通过各种商业智能BI前端可视化分析工具或者报表工具来访问数据仓库,最终是面向报表查询,数据分析服务,为业务人员提供复盘、预测,为企业管理人员提供决策信息的。

数据仓库建模方式

在Kimball和Inmon两位数据仓库领域大佬不同方向的经验指导下,数据仓库的建模已经是一个成熟的体系,可以根据需求选择不同的方式,既有三范式 3NF 建模,也有维度建模比如星型或雪花型的建模方式。

打开网易新闻 查看精彩图片

数据仓库 - 派可数据商业智能BI可视化分析平台

数据仓库还有着分层结构,每个分层结构都有各自的作用,比如经常看到的ODS 层、Trans 层、Dimension 层、Data Mart 层等,都是为了将数据从大海中进行筛选,从分散到集中进行高度汇总,形成一个个的主题,为后续的前端数据可视化分析提供数据的支撑。

数据仓库为了业务分析的目的,因此需要拉通各个业务系统数据库的数据,保留大量历史数据,同时为了分析效率的提升改变了传统数据库的数据组织形式,例如利用适合于分析型模型的Kimball维度建模方式来组织底层数据架构。

打开网易新闻 查看精彩图片

数据可视化分析 - 派可数据商业智能BI可视化分析平台

数据仓库服务于商业智能BI分析,通过商业智能BI前端可视化分析工具来访问,是其中不可或缺的一部分。并且在长期的建设中,商业智能BI已经形成了一套直接零代码配置并完成数仓建模的整个过程,进行了完整的产品化,解决了困难的架构与模型的问题。

数据仓库作为商业智能BI系统中的一部分,已经成长为了企业信息化建设中必不可少的重要支撑,在可见的未来,数据仓库还会随着信息化、数字化技术、理念、应用的落地,继续成长。