机器学习（十二）

四个方面：

　　1、基于数据改善性能

　　2、借助算法改善性能

　　3、用算法调参改善性能

　　4、借助模型融合改善性能

1、基于数据改善性能

　　改变你的训练集数据以及问题定义方式。

获得更多的数据；
数据扩充；
清洁数据：可以纠正或删除一些缺失或错误的观测值，或者在合理范围外的离群点，从而提升数据质量；
重新界定问题：你能否改变你正试图解决的问题类型？重构数据，如回归，二项或多项分类，时间序列，异常检测，评分，推荐等问题类型。
重新缩放数据：归一化和标准化处理可以提升使用加权或距离度量的算法性能。
转化数据：使得数据更服从高斯分布，或进行指数变换可能会暴露出数据更多的特征供算法学习。
特征选择：使用特征选择和衡量特征重要性的方法，可以创造出数据的新视角，供模型算法探索。
特征工程：你能够创造或者增加新的特征？也许有的属性可以分解为多个新的值（比如类别，日期或字符串）或者属性可以聚集起来代表一个事件（如一个计数，二进制标志或统计信息）

2、借助算法改善性能

3、用算法调参改善性能

　　调整的策略：充分挖掘性能良好的算法的潜力。

4、借助模型融合改善性能

　　策略：组合多个性能良好的模型预测结果。

转载自csdn：https://blog.csdn.net/han_xiaoyang/article/details/53453145