【吴恩达机器学习】学习笔记—

梯度下降算法能够帮助我们快速得到代价函数的最小值

算法思路：

梯度下降算法：

上式中的α是学习速率，决定了θ_j移动的步伐大小。如果α太小，那么θ_j就会更新的很慢；但是如果α太大，θ_j就有可能越过最低点，导致偏导数越来越大，最终远离最低点不收敛。

而上式的偏导数的作用十分巧妙，当θ_j越来越接近局部最低点时，相应地，偏导数会越来越小，因此θ_j更新的幅度会越来越小，直至收敛。