关于大数据中的统计分析业务一例

有些同学对于大数据工作上的业务可能会觉得非常高大上或者很玄乎,但是还是有比较简单传统的业务应用于大数据的,只是实现的方式就不是通过传统的关系型数据库技术来实现了。

以下是一个最经典的业务场景,通常的移动应用的运营体系都跑不掉统计这些指标,然后根据实际的业务场景定制行业指标。那么我们下面的指标如果不是通过传统的关系型数据库来实现,那会以什么样的方式实现呢?

在大数据里有一个很重要的概念,那就是数据仓库,简称数仓。关于数仓的详细概念定义同学们可以自己私下脑补一下,这里简单的说就是只用来做统计计算而不会对其字段内容进行删除修改的表。而这个表一般数据量都是很庞大的,不可能再存储于再关系型数据看中,所以就用到我们的大数据生态中的hive来构建数仓。

 

当数仓的构建完成之后,我们就使用数仓给不同的业务提供更上层的服务,如数据报表的指标统计结果,数据分析图表,用户画像构建等。从而给运营的同学们提供数据支持、给数据挖掘数据分析的同学们提供最基层的数据服务。(上海尚学堂大数据培训原创)

原文地址:https://www.cnblogs.com/shsxt/p/7717335.html