关于梯度下降 有了线性方程以及他的代价函数: 然后我们的目标就是通过调整 theta0, theta1 最小化 J 的值。 那么梯度下降算法的公式如下: alpha 是学习率,后面是对J和theta求偏导,以便得到这个点斜率,如果斜率为正就逐渐缩小theta,这样就逐步的调整到适合的theta 在Octave中表示为: theta = theta - (alpha/m) * X' * (X*theta - y) 循环调用这个计算多次已达到收敛。 最后就能得出这样一组 theta