通过 Batch Normalization 的方式 normalize 神经网络层的输入,以解决的 internal covariate shift 问题。
则 Batch Normalization 为:
注:
γ,β 如同权值矩阵w 和偏值向量b 一样都是待学习的参数;
通过 Batch Normalization 的方式 normalize 神经网络层的输入,以解决的 internal covariate shift 问题。
则 Batch Normalization 为:
注: