python数据探索与数据与清洗概述

数据探索的核心:

1、数据质量分析(跟数据清洗密切联系,缺失值、异常值等)

2、数据特征分析(分布、对比、周期性、相关性、常见统计量等)

数据清洗的步骤:

1、缺失值处理(通过describe与len直接发现、通过0数据发现)

2、异常值处理(通过散点图发现)

一般遇到缺失值,处理方式为(删除、插补、不处理)

插补 

遇到异常值,一般处理方式为视为缺失值、删除、修补(平均数、中位数等)、不处理。

原文地址:https://www.cnblogs.com/gaojr/p/12092088.html