学习中的梯度下降Ⅱ-学习率

调试梯度下降。用x轴上的迭代数绘制一个图。现在测量成本函数,J(θ)随迭代次数下降。如果J(θ)不断增加,那么你可能需要减少α。

自动收敛试验。如果该声明收敛(θ)小于E在一次迭代中减少,其中E是一些小的值,如10−3。然而,在实践中很难选择这个阈值。

它已被证明,如果学习率α足够小,那么J(θ)每次迭代都减小。

总结:
如果α太小,收敛速度慢
如果α太大:可能不会在每次迭代不收敛,从而降低。

原文地址:https://www.cnblogs.com/zhengzhe/p/7224573.html