统计学和数据挖掘的关系

数据挖掘和统计学是交集的关系,它们之间有很强的关系,但不是一个涵盖另一个。

统计学是从小样本数据分析,推测总体的特征。而数据挖掘是从尽可能大的数据集上直接寻找特征。

应用方法上,数据挖掘多用于主动式的发现,而统计学多用于被动式的验证。

从大量的商业项目实践中,我们体会到数据挖掘探索与统计学分析很多时候结果是一致的,但数据挖掘的结果往往更优于统计学分析的结果,原因可能是,有时数据挖掘分析的数据比统计学分析的数据更大,因此数据挖掘得到的模型可能更精确些。

因此,我们常常应用统计学对数据挖掘的结果进行评估和验证。

原文地址:https://www.cnblogs.com/NaughtyBaby/p/4513411.html