机器学习技巧学习

转载自:https://blog.csdn.net/wtq1993/article/details/51418958 

LB,CV分数

在某些比赛中,由于数据分布比较奇葩或是噪声过强,Public LB 的分数可能会跟 Local CV 的结果相去甚远。可以根据一些统计测试的结果来粗略地建立一个阈值,用来衡量一次分数的提高究竟是实质的提高还是由于数据的随机性导致的。

 数据探索

数据预处理:

这一部分的处理策略多半依赖于在前一步中探索数据集所得到的结论以及创建的可视化图表

Feature 为主,调参和 Ensemble 为辅

 

原文地址:https://www.cnblogs.com/bafenqingnian/p/9199543.html