19:train-val-test划分(以检测过拟合挑选最好的模型参数)

1:train-val-test数据集的划分(6:2:2)

 [注]val 数据集其实质也是test,其只不过是在train数据集中划分出来的test数据集以选择合适的参数(防止选择的参数出现过拟合现象如图1中,当Degrees=5时,参数的选择最好,大于5会出现过拟合现象)。

2:k-flod cross validation划分

 

 [注]由于pytorch中没有val set的划分,故可以通过train_db,val_db=torch.utils.random_split(train_db,[50000,10000])函数将划分好的train_db再次划分,即可得到三个部分的数据集。

原文地址:https://www.cnblogs.com/jiafeng1996/p/15091315.html