ER模型(Bill Inmon 比尔·恩门)提出 (大型企业底层构建)
1,整体性考虑:全面了解企业业务和数据
2,实施周期长
3,建模人员的能力要求高
步骤:
高层模型:考虑所有上层主题,主题之间的关系
中层模型:细化 上层主题 数据项
物理模型:基于性能,存储,平台特点,数据合并,分区设计
维度建模(Ralph Kimball 拉尔夫·金博尔)提出 (当前最主流的模型)
星型:所有维表直接连接到事实表
雪花型: 当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上
(雪花型场景:
1, 大型客户维度,客户属性需要隐匿
2,银行、金融多种产品属性无法共享
3,多切页日历维,结账期、季度、假期
)
建模过程
1,选择需要进行分析决策的业务过程
2,选择粒度:时间维度
3,识别维表:基于粒度设计维表,包括维度属性,用于分析时进行分组和筛选
4,选择事实:确定分析需要衡量的指标,筛选有用字段
Data Vault 模型:ER模型的衍生,设计出发点是为了实现数据整合,但不能直接用于数据分析决策。强调数据的历史性、可追溯性和原子性。范化程度较高
Anchor 模型:对Data Vault进一步范化处理,核心思想是所有的扩展都是添加而不是修改,模型高度范化,6NF。基本变成k-v结构模型