商业数据分析第二记

数据分析

收集的数据要进行清洗,把无用的数据舍弃,对有效数据进行分析。

数据的质量:重复?完整?一致?时效?

数据的形式:结构化数据;半结构化数据;非结构化数据

结构化数据:SQL数据(完全限制格式)

半结构化数据:JSON(整体有着一定的格式,具体是非结构化的数据)——既有结构化数据,又有非结构化数据

非结构化数据:图像,文本

数据分析的好处(通俗化):

搞清事实,接近真相,预测未知,帮助决策

逐步挖掘商业价值的分析(学术):

描述分析,诊断分析,预测分析,指导分析(Excel,Python)

分析所用的一些模型:

分析方法与工具:

另外,学会使用GitHub!

数据可视化:

为了更好的阅读,为了更好的解析结果,我们把结果可视化,但是,可视化的方式不对,可能会得到完全没用的结论。举例如下:

这是9月份同比销售额的可视化:

不同的可视化方式,得到完全不一样的视觉效果,由此得到不一样的结果。更甚者,有恶意可视化,完全与真实相反,误导人们的眼球。

可视化的时候,注意选取正确的可视化方法。

典型数据驱动开发团队人员:

大型的项目需要一个团队共同协作才能做得更好!

原文地址:https://www.cnblogs.com/HS-learning-10/p/11018378.html