特征漂移检测

思路:
评价测试集与训练集分布是否相像,如果不像,则有可能是发生了漂移。

评价方法:

  1. 对训练集打标签0,测试集打标签1生成新数据集
  2. 训练一个二分类模型
  3. 评价AUC指标,如果非常高,则发生漂移(模型能轻易分辨出训练和测试数据)
  4. 依据特征重要性,删除若干个指标,重新训练,并重复步骤2-4,直到auc很低
  5. 用保留下来的数据训练模型
原文地址:https://www.cnblogs.com/oaks/p/14501407.html