数据产品-OLAP

OLAP和BI是日常工作中比较熟悉的了,也是经常会接触到的,这里总结下。

这里先说一个概念:数据立方体

我们分析一堆数据报告时候通常这些数据报告采用二维表示,是行与列组成的二维表格。但在我们分析数据的角度很可能有多个,数据立方体可以理解为就是维度扩展后的二维表格。但更多时候数据立方体是多维的,如下图数据立方体:

数据立方体中常规的五大操作:切片,切块,旋转,上卷,下钻

1. 切片和切块(Slice and Dice)

在数据立方体的某一维度上选定一个维成员的操作叫切片,而对两个或多个维执行选择则叫做切块。

切片:我选择了2011 2012 2013年份 北京 上海 广州地区的鞋子销量

切块:我选择了2011 2012 2013年份 北京 上海 广州地区的鞋子和裤子销量

 2. 旋转(Pivot)

旋转就是指改变报表或页面的展示方向。对于使用者来说,就是个视图操作。拿上图举例就是把X轴和Z轴替换一下。

 3. 上卷和下钻

上卷可以理解为"无视"某些维度;下钻则是指将某些维度进行细分。

上卷:我把Y轴地区上卷为国家,那么我要看2011 2012 2013年份 中国的鞋子销量

下钻:我把X轴的年份下钻为月份,那么11 12  13月份 北京 上海 广州地区的鞋子销量

不同的OLAP工具也会提供自有的OLAP查询功能,如钻过,钻透等,通常一个复杂的OLAP查询是多个这类OLAP操作叠加的结果。

OLAP的架构模式:

1. MOLAP :

 MOLAP架构会生成一个新的多维数据集,也可以说是构建了一个实际数据立方体

2. ROLAP :

ROLAP架构并不会生成实际的多维数据集,而是使用星形模式以及多个关系表对数据立方体进行模拟。

3. HOLAP

这种架构综合参考MOLAP和ROLAP而采用一种混合解决方案,将某些需要特别提速的查询放到MOLAP引擎,其他查询则调用ROLAP引擎。

====================================================================================分割

 数据仓库建设好以后,用户就可以编写SQL语句对其进行访问并对其中数据进行分析。但每次查询都要编写SQL语句的话,未免太麻烦,而且对维度建模数据进行分析的SQL代码套路比较固定。于是,便有了OLAP工具,它专用于维度建模数据的分析。而BI工具则是能够将OLAP的结果以图表的方式展现出来,它和OLAP通常出现在一起。

度建模数据仓库中,OLAP/BI工具和数据仓库的关系是这样的:

通常在维度建模数据仓库中,OLAP从数据仓库中直接取数进行分析

原文地址:https://www.cnblogs.com/codewan/p/10945185.html