【9】归一化输入与标准化

提高训练速度的方法：归一化输入

假设数据集的每一个训练样本只有两个特征x1、x2，那么训练集：
$X=egin{bmatrix} x_{1}^{(1)} & x_{1}^{(2)} & ... & x_{1}^{(m)} \ x_{2}^{(1)} & x_{2}^{(2)}& ... & x_{2}^{(m)} end{bmatrix}$

原始数据集

绘制出的图形如图所示，要对其进行标准化分为两步：

1、对训练集进行零均值化处理，顾名思义，也就是处理后的数据集的均值为零。
2、归一化方差。即使方差变为1。

分步讲解：

1、怎样来使均值变为0呢？首先我们需要算出数据集的平均值：

$mu =sum_{i=1}^{m}left ( X^{i} ight )$

求得的均值是一个向量，这里的x1是所有训练样本x1的均值。x2同理：

$mu =egin{bmatrix}x_{1}\ x_{2}end{bmatrix}$

然后用数据集的每一项减去这个均值就可以使整个数据集的均值为0了。

$X=X-mu$
所得X如下所示：
$X=egin{bmatrix} x_{1}^{(1)}-x_{1} & x_{1}^{(2)}-x_{1} & ... & x_{1}^{(m)}-x_{1} \ x_{2}^{(1)}-x_{2} & x_{2}^{(2)}-x_{2}& ... & x_{2}^{(m)}-x_{2} end{bmatrix}$