【心跳信号分类预测】Datawhale打卡- Task05 模型融合 (尝试记录)

教程的纲要

简单加权融合:
- 回归（分类概率）：算术平均融合（Arithmetic mean），几何平均融合（Geometric mean）；
- 分类：投票（Voting)
- 综合：排序融合(Rank averaging)，log融合
stacking/blending:
- 构建多层模型，并利用预测结果再拟合预测。
boosting/bagging（在xgboost，Adaboost,GBDT中已经用到）:
- 多树的提升方法

简单加权融合
- 回归：多分类不适用——直接放弃.
- 投票制：没有成功跑分成功，lgb无法再五折交叉验证后仍可以输出模型用于投票，待提问。
- 综合：
  - 排序融合: 待调研学习
  - log融合: 待调研学习
stacking/blending
- stack：
  - lgb+lgb => logistic，负优化100+loss
  - lgb+lgb+lgb => logistic，负优化400+loss
  - cat+lgb => logistic，负优化400+loss
- blending：数据量太少，不尝试
boosting
- xgb, 未使用，负优化,调参后,相较于lgb更差
- lgb, 单轮或者多轮融合,多轮效果更差
- cat, 暂未找到合适的多分类的结果输出参数方式,按prob的概率输出多分类结果,高方差高偏差,弃用
bagging
- 不适用
尝试nn模型
- MLPClassifier (from sklearn.neural_network import MLPClassifier,MLPRegressor) 效果极差,待后续优化
- MLPRegressor 不适合
- CNN 没学过，TODO
- RNN 没学过，TODO

你不逼自己一把，你永远都不知道自己有多优秀！只有经历了一些事，你才会懂得好好珍惜眼前的时光！