数据挖掘------数据预处理之缺失值可视化

对于数据挖掘问题,经常遇到超过1000M的数据量,600多个特征,十万条数据,其中难免属性数据的缺失以及脏数据

数据预处理的过程,在特征选择之后往往进行缺失值和异常值的处理,缺失值的可视化非常直观地展示了缺失数据的结构。

1.未缺失数据

 2.构造缺失数据与可视化

 3.另外几种可视化方法,为特征选择做了足够的准备:

可视化的参考博客

https://blog.csdn.net/andy_shenzl/article/details/81633356

数据挖掘基本流程和入门级别的方法如下

每一个不曾起舞的日子,都是对生命的辜负。
原文地址:https://www.cnblogs.com/randy-lo/p/14365287.html