Overfitting & Train Set & Test Set

假设数据集是独立同分布的,可以将数据集划分为不同的比例:Train Set and Test Set.

 同时在Train Set and Test Set上做精度测试,或者隔一段时间在Test Set上做测试,来判断训练模型是否发生过拟合,受否需要提前的终止,目的是选择最好的模型参数。(严格的说,其实应该是Validation)

 严格的会分为三部分:Train Set; Validation Set(提前终止,提高泛化能力); Test Set(不会得到)

K-fold cross-validation:每个数据都有可能back propagation。

换着方式取Train Set,将能利用的数据都利用起来:

减缓过拟合的方法:

1) regularization

2)momentum

3)Learning rate tunning

4)Early Stopping

5)Dropout

pytorch和tensorflow中的Dropout参数含义是不同的

 

原文地址:https://www.cnblogs.com/lemonzhang/p/13496188.html