大数据分析——方法

参考博文:https://blog.csdn.net/AvenueCyy/article/details/104405747

一、什么是探索性数据分析?

EDA (Exploratory Data Analysis),即对数据进行探索性的分析。充分了解数据,为之后的数据清洗和特征工程等提供想法和结论。在探索分析时,也可进行数据清洗的工作,两者是相辅相成的,没有说必须按照顺序去执行。

主要包括以下三个方面:分布分析,统计量分析和相关分析。
分布分析:定量定性分析。
统计量分析:集中,离散趋势和分布形状。
相关分析:单个图,图矩阵,相关系数。

原文地址:https://www.cnblogs.com/cfancy/p/13790191.html