星型模型&& 雪花模型

星形模式是一种多维的数据关系,它由一个事实表(Fact Table)和一

组维表(Dimension Table)组成。每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。事实表的非主键属性称为事实(Fact),它们一般都是数值或其他可以进行计算的数据;而维大都是文字、时间等类型的数据,按这种方式组织好数据我们就可以按照不同的维(事实表主键的部分或全部)来对这些事实数据进行求和(summary)、求平均(average)、计数(count)、百分比(percent)的聚集计算,甚至可以做20~80分析。这样就可以从不同的角度数字来分析业务主题的情况。







雪花模型是当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。
当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 "层次 " 区域,这些被分解的表都连接到主维度表而不是事实表。
相比星型模型,雪花模型的特点是贴近业务,数据冗余较少,但由于表连接的增加,导致了效率相对星型模型来的要低一些。

雪花模型使用的是规范化数据,也就是说数据在数据库内部是组织好的,以便消除冗余因此它能够有效地减少数据量。通过引用完整性,其业务层级和维度都将存储在数据模型之中

星型模式一种使用关系数据库实现多维分析空间的模式,称为星型模式。

雪花模式,不管什么原因,当星型模式的维度需要进行规范化时,星型模式就演进为雪花模式。



整理清晰的blog :http://yangjinyu.dream.blog.163.com/blog/static/115148886201322041022841/






原文地址:https://www.cnblogs.com/TendToBigData/p/10501458.html