数据仓库模型数据仓库四大模型

tech2022-08-09  140

ER模型(Bill Inmon 比尔·恩门)提出  (大型企业底层构建)

1,整体性考虑:全面了解企业业务和数据

2,实施周期长

3,建模人员的能力要求高

步骤:

高层模型:考虑所有上层主题,主题之间的关系

中层模型:细化 上层主题 数据项

物理模型:基于性能,存储,平台特点,数据合并,分区设计

 

维度建模(Ralph Kimball 拉尔夫·金博尔)提出 (当前最主流的模型)

星型:所有维表直接连接到事实表

雪花型: 当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上

(雪花型场景:

   1, 大型客户维度,客户属性需要隐匿

   2,银行、金融多种产品属性无法共享

   3,多切页日历维,结账期、季度、假期

建模过程

1,选择需要进行分析决策的业务过程

2,选择粒度:时间维度

3,识别维表:基于粒度设计维表,包括维度属性,用于分析时进行分组和筛选

4,选择事实:确定分析需要衡量的指标,筛选有用字段

 

Data Vault 模型:ER模型的衍生,设计出发点是为了实现数据整合,但不能直接用于数据分析决策。强调数据的历史性、可追溯性和原子性。范化程度较高

Anchor 模型:对Data Vault进一步范化处理,核心思想是所有的扩展都是添加而不是修改,模型高度范化,6NF。基本变成k-v结构模型

最新回复(0)