归一化,标准化和中心化

https://www.zhihu.com/question/20467170
参考了知乎的回答,以及wiki的解释,个人的理解如下:
归一化和标准化本质上都是对数据集特征的缩放,而wiki的解释中特征的缩放一般有四种不同的公式

Rescaling (min-max normalization)

x'={frac  {x-{	ext{min}}(x)}{{	ext{max}}(x)-{	ext{min}}(x)}}

{displaystyle x'=a+{frac {(x-{	ext{min}}(x))(b-a)}{{	ext{max}}(x)-{	ext{min}}(x)}}}

Mean normalization

{displaystyle x'={frac {x-{	ext{average}}(x)}{{	ext{max}}(x)-{	ext{min}}(x)}}}

Standardization (Z-score Normalization)

x' = frac{x - ar{x}}{sigma}

Scaling to unit length

{displaystyle x'={frac {x}{left|{x}
ight|_{2}}}}

归一化的一般方法就是上面公式中的第一个公式,而标准化的方法常用公式就是Z-score的方法,这两个方法都属于线性转换,都是按比例缩放,但是归一化还有其他方法,不一定是按比例缩放的,这样就会导致数据的分布不一样。

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">





原文地址:https://www.cnblogs.com/raisok/p/11133079.html