关于softmax稳定性问题

因为softmax中指数函数,很容易超出计算机表达的最大值,所以采用分子分母同时乘N的方法,N一般为最大值。

原文地址:https://www.cnblogs.com/mdumpling/p/8094194.html