RF & Microarray

REF[24]

随机森林是一个很好适用于微阵列数据的分类算法:

1.即使大多数的预测变量都是噪音,RF仍然具有优秀的性能,因此不需要对基因进行预选择。

2.能够应用于变量数远远大于观测数据量的情况

3.能用于两类和多于两个分类问题的情况

4.返回变量重要性测量

5.不会过拟合

6.能处理分类和连续预测器的混合

7.合并预测变量间的相互作用

8.对于预测器的单调变换,输出不变

9.高质量免费的实现,如R

10.几乎不需要调整参数来获得优秀的性能

 

原文地址:https://www.cnblogs.com/Acceptyly/p/3586919.html