分层采样

训练和测试集的划分要尽可能保持数据分布的一致性,避免因数据划分过程中引入额外的偏差而对最终结果产生影响,例如在分类任务重至少要保持样本的类别比例相似,如果从采样的角度来看待数据集的划分过程,则保留类别比例的采样方式通常称为“分层采样”。就是训练和测试的数据集中,正负样本比例一致,即训练集中正负比例为2:1,则测试集中正负比例为2:1。

1、机器学习

原文地址:https://www.cnblogs.com/enhaofrank/p/12899493.html