Aggregation 聚集

n  根据CUBE中几个或者一个维度信息对象创建的Mini Cube(更小的Cube),可以提高数据的访问效率,当查询访问CUBE时,若聚集中的维度能满足查询条件则只需访问聚集而非CUBE

n  结构:新生成一张事实表外加一些对应的维度表

n  用空间换时间、数据是冗余的

n  聚集可以建立在特征值、属性、层级上,即聚集与关键值无关

注:聚焦就只针对Cube来做的,就是在下层Cube(数据明细一点)上逐渐向上层Cube不断汇总,这一过程数据条数据会越来越少,数据粒度越来越粗(因为维度字段减少了)

 

Cube一般也有F表与E表两种,但一般直接使用E

 

 

在CUBE上右击,选择“维护合计”即可跳转到聚集维护界面:

image235

 

激活与填充:将大Cube里的数据汇总填充到该聚焦(小Cube)里:

image236

 

点眼镜即可查看数据:

image237 image238

 

image239

上线时先预创建几个聚集,一般根据使用次数来取舍这些聚集

 

在查询时,如果以 物料+销售,则不会用到上面的聚集,这时会去找大Cube去了:

image240image241

 

如果只以物料维度来查时,这时会用到上面创建的聚焦:

image242image243

 

下面再创建一个 销售 + 物料 的聚集:

image244

 

然后通过销售+物料报表进行查询,此时会使用到上面创建的 销售物料 聚集:

image245

image246

 

当只以销售维度去查时,还是会用到上面创建的销售+物料 聚集,虽然该聚集还有物料维度,但比起大Cube 销售+物料+客户 的维度少,这就意味着该聚集里的数据量少,也就是查询速度要快,所以还是会从销售物料 聚集中查询:

image247

image248

 

优先查找原则:从维度最少但满足条件的聚集里去找。比如只有物料维度的报表查询时,会从 物料聚集里去查找

 

再建一个销售+客户的聚焦:

image249

 

当查询只有销售维度报表时,这时从表面上看有两个聚焦(销售销售、销售客户)满足条件,但此会从条数最少的里面找(也可能是根据评估等级)?

image250 image251

原文地址:https://www.cnblogs.com/jiangzhengjun/p/4294637.html