Momentum

一、目的

加快参数的收敛速度。

二、做法

另第t次的权重更新对第t+1次的权重更新造成影响。

从上式可看出,加入momentum后能够保持权重的更新方向,同时加快收敛。通常alpha的取值为[0.7, 0.95]

原文地址:https://www.cnblogs.com/llxrl/p/4342864.html