tensorflow2.0——梯度爆炸处理

原来的参数更新代码:

  

 加一个Graddient Clipping后(原理是当梯度高于某个阈值时,自动除以自己的模来达到减小梯度的目的):

比如下图中设置梯度最大值为15

  

原文地址:https://www.cnblogs.com/cxhzy/p/13825884.html