AdaBoost scikit-learn相关参数

1.AdaBoostClassifier

base_estimator:弱分类器对象,默认为CART分类树
DecisionTreeClassifier;
algorithm:SAMME和SAMME.R;SAMME表示构建过程中
使用样本集分类效果作为弱分类器的权重;SAMME.R使用对样本集分类的预测概率大小作为弱分类器的权重。由于SAMME.R使用了连续的概率度量值,所以一般迭代比SAMME快,默认参数为SAMME.R;强调:使用SAMME.R必须要求base_estimator指定的弱分类器模型必须支持概率预测,即具有predict_proba方法。
loss:不支持
n_estimators:最大迭代次数,值过小可能会导致欠拟合,值过大可能会导致过拟合,一般50~100比较适合,默认50。
learning_rate:指定每个弱分类器的权重缩减系数v,默认为1;一般从一个比较小的值开始进行调参;该值越小表示需要更多的弱分类器。

2.AdaBoostRegressor

base_estimator:弱回归器对象,默认为CART回归树DecisionTreeRegressor;
algorithm:不支持
loss:指定误差的计算方式,可选参数”linear”, “square”,
“exponential”, 默认为”linear”;一般不用改动。
n_estimators:最大迭代次数,值过小可能会导致欠拟合,值过大可能会导致过拟合,一般50~100比较适合,默认50。
learning_rate:指定每个弱分类器的权重缩减系数v,默认为1;一般从一个比较小的值开始进行调参;该值越小表示需要更多的弱分类器。

原文地址:https://www.cnblogs.com/tankeyin/p/12327829.html