数据分析六步(结合wrf)

1.明确数据分析的目的及内容    2.数据的来源和收集    3.数据的处理    4数据的分析    5后处理及可视化    6.撰写文档

一 、数据分析的六个模块

1.明确分析目的和内容
  目的是你要干什么,内容是你要为你完成的这个目的进一步要分做的几块事务

2.数据收集
数据的来源有很多了,如互联网,如在wrf中,我们是在NCEP(美国环境  中心)上下载所像数据(数据的格式有两人种grib1和grib2).在每个公司每个业务都有对应的数据库,这也是我们的数据来源。

3.数据处理
你下载的数据不一定你可以直接使用,所以你要处理
包括
   3.1数据清洗(如处理无效值,缺失值)
   3.2数据转化(如格式的转化如你在气象局上下载的是十进制的,你要转为二进制的格式以后,才可以用grads软件处理)
   3.3数据的提取(如我只要2012.07.12-2012.07.15 period的数据)
   3.3数据的计算(如wrf.exe)
结:一般到手的数据都要经过一定处理才能用户后续分析工作

4.数据分析
这一步在第一个模块的时候就要有个大致的想法,现在是具体的实现
数据分析 或 数据挖掘 ----------->对处理过的数据进行分析--------->由于数据分析是通过软件来完成的,所以数据分析师不仅要掌握各种分析方法,还要熟悉数据分析软件的操作-------->一般的数据分析软件用excel------->高级的数据分析用spss   statistic
结上一模块为这一模块准备要分析的数据,至于分析方法可以有很多如主成分分析法等

5.数据展现
即画图,制表 可视化

6.报告撰写 
是为了给决策都 参考
将数据 分的的起因 过程 结果 及建议(解决方案)四部分完整的写出来,再由决策者作决策时参考 。

二、在统计学上数据的种类就分为两种,字符型 与 数值型

在统计学上方法的各类就分为两种,描述型分析 与 探索性分析(有时分三种还有一种叫验证型)
因为我们只可能对样本进行研究,而不是对总体。对样本特征进行描述的那部分统计学称为描述性统计,通过样本情况去对总体情况进行推断的那部分统计学称为推断统计。
 

原文地址:https://www.cnblogs.com/zhengtaodoit/p/4920901.html