找到为什么是nan的问题,是因为误差没有变小,而是越来越大

找到为什么是nan的问题,是因为误差没有变小,而是越来越大

猜测:没有加载初始权重导致的误差越来越大,不可训练,在原有基础权重的基础上进行训练,否则误差变化太大导致nan问题的出现,依据:加载初始权重之后解决。

扩展:也可能是由于网络没有设置初始权重的问题、或者是自己采用detectron2的方式,而不是使用centermask2的方式进行训练引起的

原文地址:https://www.cnblogs.com/miaozhijuan/p/12560531.html