【分析云】-数据仓库设计

一、为什么要写数据仓库设计?

  在数据分析体系架构下,不管是大数据库技术方面的还是传统数据库技术层面,数据仓库都是必不可少,不能避免的环节,而这两种方式差别是数据存储、数据处理理念的不同。

二、分析云需要什么样的数仓架构?

  数据仓库的概念想必都看过很多遍,这里就不赘述了。咱就以业务开局。

  想象一下,零售场景下,仅仅有一个销售订单表,应该怎么分析呢? 订单表里有什么呢,有订单时间、门店、支付方式、商品,数量、单价、金额。就是这么些数据,该怎么建立数仓呢,废话不多说,直接上图吧。

这个图就是ROLAP下的以事实表为中心的事实表维度表关系图。

这个图中,对表有两种分类,一类是事实表,表中存储了时间、门店ID、支付方式ID、商品ID,一类是维度表,存储了维度的属性和扩展,如时间维度表:日、周、月、季度、年 等信息。

通过连线,实现了维度表和事实表的关系,这个关系的定义,也就定义了事实表和维度表关联的方式,表达式里也就是这个连线的内容,顺便说一点,这个表达式是可以编辑的哦。

看懂了这个图,恭喜你,你已经学会分析云的核心逻辑,其他的就是产品功能的学习,对你来说不在是什么大问题。

附:名词解释

维度:即是描述参与交易事实的细节成员,比如常用到的客户、产品等。维度对象在数据。分析过程中反应出分析数据的粒度和角度,若没有维度对象那么任何数据都会变得空洞、无意义,所以维度对象是不可少的。

度量:即是描述交易事实的数量、金额、个数等数据信息,比如经常用到的订单数量、订货金额等。度量对象是数据分析中核心分析对象。所有度量对象都具有一定的聚合性。

维度表:包含维度的相关信息的表,该表中一般不会定义度量。

事实表:包含维度的ID和度量等信息,是数据承载的实体。

 

 

原文地址:https://www.cnblogs.com/yunzaixiao/p/15104069.html