如何避免梯度下降到局部最小值

http://ruder.io/optimizing-gradient-descent/index.html#momentum

原文地址:https://www.cnblogs.com/fuhang/p/8927240.html