如何减少事实表的大小

早期的数据仓库构建思想是将所有能得到的数据都放入数据仓库,随着信息的爆炸,数据仓库的尺寸开始变得不可接受。有两种方法可以解决这个问题,一个是数据过滤减少进入数据仓库的数据,另一个就是通过合理的设计减小数据仓库存储空间。本文简单讨论一下第二种方法。

在维度建模的设计中,维度表占用的空间相比事实表要小很多,如何减小事实表的容量是采用第二种方法的关键。

通常有如下方法可以减小事实表的容量。

1.            将所有的自然关键字的外键都替换称整型或小整型的代理关键字。

2.            将时间戳都替换称整型或小整型的代理关键字。

3.            尽可能的将相关联的维度合并成一个超级维度。

4.            将低基数的小型维度合并成杂项维度。

5.            将文字型的描述信息移出事实表,建立事实维度。

6.            进可能的将长整型和浮点型事实替换成整型。

其中的第五条,目前的数据库都支持变长字符型字段,对于这种变长字符型字段的事实来说是不必建立事实维度的。

原文地址:https://www.cnblogs.com/zourui4271/p/5454940.html