BI过程简述

BI流程: 需求分析->维度设计->查询service->ETL倒数据->CDC监听数据库

需求分析:首先确定好的数据来源(多个数据库+excel文件+日志+...),需要的数据查询项(measure值)

维度设计:

   分析维度出发点,几个w:who ,where,when,what,how,why

   建维度表

   通过画总线矩阵来减少事实表个数

查询service:最后确定了前端使用开源框架saiku(使用了pentaho的mondrian来提供MDX到result的处理)

ETL工具:kettle(图形化界面,数据处理思想类似于awk工具)

CDC监听:使用tungsten(实现了mysql的log监听,但对oracle的redolog的监听实现并不完美)。

原文地址:https://www.cnblogs.com/cl1024cl/p/6205522.html