数据产品-数据仓库分层建模02

这次总结下维度建模的形式:星型建模,雪花建模,星座模型

(维度建模不需要数据产品去实施,但是需要了解)

先说下两个概念:事实表,维度表

1. 维度表(dimension)

比如"昨天早上我在TB使用了50元购买了一个鞋子"。那么以购买为主题进行分析,可从这段信息中提取三个维度:时间维度(昨天早上),地点维度(TB), 商品维度(鞋子)。通常来说维度表信息比较固定,且数据量小。

 2. 事实表(fact table)

比如上面那个例子中,50元就是事实信息。事实表包含了与各维度表相关联的外码,并通过JOIN方式与维度表关联。事实表的度量通常是数值类型,且记录数会不断增加。

1. 星形模式:

1.1维表只和事实表关联,维表之间没有关联;

1.2每个维表的主码为单列,且该主码放置在事实表中,作为两边连接的外码;

1.3以事实表为核心,维表围绕核心呈星形分布

2. 雪花形模式:

雪花模式(Snowflake Schema)是对星形模式的扩展,每个维表可继续向外连接多个子维表。

这种模式在实际应用中很少见,公司也基本不用,数据冗余问题的话在数据仓库里并不严重,也不用担心。

3. 星座形模式:

星座模式也是星型模式的扩展

4. 对比:

原文地址:https://www.cnblogs.com/codewan/p/10819715.html