粒度 分割

1、粒度
粒度是数据仓库的重要概念。粒度可以分为两种形式,第一种粒度是对数据仓库中的数
据的汇总程度高低的一个度量,它既影响数据仓库中的数据量的多少,也影响数据仓库所能
回答询问信息的种类。在数据仓库中,多维粒度是必不可少的。由于数据仓库的主要作用是
多维分析,因而绝大多数查询都基于一定程度的汇总数据之上的,只有极少数查询涉及到细
节。
还有一种粒度形式,即样本数据库。它根据给定的采样率从细节数据库中抽取出一个子
集。这样样本数据库中的粒度就不是根据汇总程度的不同来划分的,而是有采样率的高低来
划分,采样粒度不同的样本数据库可以具有相同的数据汇总程度。
2、分割
分割是数据仓库中的数据存储中的另外一个重要概念,它的目的在于提高效率。它是将数
据分散到各自的物理单元中去, 以便能分别独立处理,以实现查询操作的并行。有许多数据
分割的标准可供参考:如时间、地域、业务领域等等,也可以是其组合。一般而言,分割标准总
应包括一些能让它十分自然而且分割均匀的项目,例如时间项。
原文地址:https://www.cnblogs.com/honkcal/p/2107138.html