数据仓库模型宽表设计思想一

一、典型的数据仓库建模思想一般主流分为两种

第一种
ER模型是数据仓库之父父 Bill lnmon 提出的建模方法是从全企业的高度设计
3NF 模型,用实体关系( Entity Relationship, ER )模型描述企业业
务,在范式理论上符合 3NF 。后续又有人通过在其基础进行衍生和优化发展了 Data Vault 模型和Anchor 模型(具体类型思想可自行资料)
第二种
维度模型:维度模型是数据仓库领域的 Ralph Kimball 大师所倡导的,数据仓库工程领域最流行的数据仓库建模的经典。维度建模是从分析决策的需求出发构建模型。较好的大规模复杂查询的响应性能。其典型的代表是星形模型。具体业务设计可以分为以下几个步骤。
1、选择需要进行分析决策的业务过程。(业务工程中可以是单个业务事件,比如交易的支付、退款等;也可以是某个业务事件的状态,比如当前的账户余额;当然还可以是一系列的相关的业务事件组成业务流程,具体需要我们分析某些事件的发生情况,还是当前的状态,或者事件流转效率。)
2、选择合适粒度(我们要预判所有分析需要细分的程度,从而决定选择的粒度。粒度是维度的一个组合。)
3、识别维表(选择好粒度之后,就需要基于此粒度设计维表,包括维度的属性,用于后续我们进行分组和筛选)
4、选择实时表(确定分析需要的衡量指标)

二、数据仓库建模中规范定义

规范定义是指以维度建模为理论基础,对不同层级的做定义。规范数据体系架构命名:
具体的数据体系架构如下:

在这里插入图片描述定义规范:(参考阿里)
数据域:

猜你喜欢

转载自blog.csdn.net/weixin_40809627/article/details/107382205