维度建模工具

tech2024-04-15  82

幵始维度建模工作前,项目组需要理解业务需求,以及作为基础的源数据的实际情况。 通过与、 Ik务代表交流来发现需求,用于理解他们的基于关键性能指标、竞争性商业问题、 决策制定过程、支持分析需求的目标。同时,数据实际情况可以通过与源系统专家交流, 构建高层次数据分析访问数据可行性来揭示。 维度模型设计期间主要涉及 4 个主要的决策: (1) 选择业务过程 (2) 声明粒度 (3) 确认维度 (4) 确认事实 要回答上述问题,需要考虑业务需求以及协作建模阶段涉及的底层数据源。按照业务 过程、粒度、维度、事实声明的流程,设计组确定表名和列名、示例领域值以及业务规则。 而业务数据管理代表必须参与详细的设计活动,以确保涵盖正确的业务。 业务过程是组织完成的操作型活动,例如,获得订单、处理保险索赔、学生课程注册 或每个月每个账单的快照等。业务过程事件建立或获取性能度量,并转换为事实表中的事 实。多数事实表关注某一业务过程的结果。过程的选择是非常重要的,因为过程定义了特 定的设计目标以及对粒度、维度、事实的定义。每个业务过程对应企业数据仓库总线矩阵 的一行。 声明粒度是维度设计的重要步骤。粒度用于确定某一事实表中的行表示什么。粒度声 明是设计必须履行的合同。在选择维度或事实前必须声明粒度,因为每个候选维度或事实 必须与定义的粒度保持一致。在所有维度设计中强制实行一致性是保证 BI 应用性能和易用 性的关键。在从给定的业务过程获取数据时,原子粒度是最低级别的粒度。我们强烈建议 从关注原子级别粒度数据幵始设计,因为原子粒度数据能够承受无法预期的用户查询。上 卷汇总粒度对性能调整来说非常重要,但这样的粒度往往要猜测业务公共问题。针对不同 的事实表粒度,要建立不同的物理表,在同一事实表中不要混用多种不同的粒度。 维度提供围绕某一业务过程事件所涉及的“谁、什么、何处、何时、为什么、如何” 等背景。维度表包含 BI 应用所需要的用于过滤及分类事实的描述性属性。牢牢掌握事实表 的粒度,就能够将所有可能存在的维度区分幵。当与给定事实表行关联时,任何情况下都 应使维度保持单一值。 维度表有时被称为数据仓库的“灵魂”,因为维度表包含确保 DW/BI 系统能够被用作 业务分析的入口和描述性标识。主要的工作都放在数据管理与维度表的幵发方面,因为它 们是用户 BI 经验的驱动者。 事实涉及来自业务过程事件的度量,基本上都是以数量值表示。一个事实表行与按照 事实表粒度描述的度量事件之间存在一对一关系,因此事实表对应一个物理可观察的事件。 在事实表内,所有事实只允许与声明的粒度保持一致。例如,在零售事务中,销售产品的 数量与其总额是良好的事实,然而商店经理的工资不允许存在于零售事务中。

最新回复(0)