【DL】几种参数优化方法的比较

https://zhuanlan.zhihu.com/p/22252270

结尾的两张图不能更赞。

PS:在用lstm做文本分类的时候,加了L2正则,把optim方法由之前的SGD换成Adam,效果提升显著。

原文地址:https://www.cnblogs.com/colipso/p/8384841.html