# 机器学习算法总结-第四天(SKlearn/数据处理and特征工程)

总结:

  1. 量纲化(归一化,标准化)
  2. 缺失值处理(补0、均值、中值、众数、自定义)
  3. 编码/哑变量:忽略数字中自带数学性质(文字->数值类型)
    Alt text
  4. 连续特征离散化(二值化/分箱处理)
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
原文地址:https://www.cnblogs.com/afanti/p/10881435.html