关于梯度下降

有了线性方程以及他的代价函数：

然后我们的目标就是通过调整 theta0, theta1 最小化 J 的值。

那么梯度下降算法的公式如下：

$small heta _{j} = heta_{j} - alphafrac{partial }{partial heta_j}J( heta_0, heta_1)$ alpha 是学习率，后面是对J和theta求偏导，以便得到这个点斜率，如果斜率为正就逐渐缩小theta，这样就逐步的调整到适合的theta

在Octave中表示为：

theta = theta - (alpha/m) * X' * (X*theta - y) 循环调用这个计算多次已达到收敛。

最后就能得出这样一组 theta