通过对回归树随机森林的包外预测器观察的排列来估计预测器的重要性
返回的向量out- bag,通过排列估计预测器的重要性使用回归树的随机森林小鬼
= oobPermutedPredictorImportance (Mdl
)Mdl
.Mdl
必须是一个RegressionBaggedEnsemble
模型对象。
当种植随机森林使用fitrensemble
:
标准CART倾向于选择包含许多不同值(如连续变量)的分离预测因子,而不是包含很少不同值(如分类变量)的分离预测因子[3].如果预测器数据集是异构的,或者如果有比其他变量具有相对较少的不同值的预测器,那么考虑指定曲率或交互测试。
使用标准CART生长的树木对预测变量相互作用不敏感。此外,与交互测试的应用相比,在存在许多无关的预测因子时,这种树不太可能识别出重要的变量。因此,为了解释预测变量之间的交互作用,并在存在许多不相关变量的情况下识别重要变量,指定交互作用检验[2].
如果训练数据包含许多预测器,而您想要分析预测器的重要性,那么请指定“NumVariablesToSample”
的templateTree
函数作为“所有”
对于合奏的树型学习者。否则,软件可能不会选择一些预测因子,低估它们的重要性。
有关详细信息,请参见templateTree
和选择分裂预测器选择技术.
[1] Breiman, L., J. Friedman, R. Olshen, C. Stone。分类与回归树.佛罗里达州博卡拉顿:CRC出版社,1984。
[2] Loh, W.Y., <具有无偏变量选择和交互检测的回归树>Statistica中央研究院, 2002年第12卷,第361-386页。
Loh w.y y and Y.S. Shih分类树的分裂选择方法Statistica中央研究院, 1997年第7卷,第815-840页。