预测对袋外预测测量观测的置换的重要性估计,用于分类树的随机森林
返回矢量的矢量out- bag,通过排列估计预测器的重要性使用随机森林的分类树偶尔
= OobperMutedPredictorimportance(Mdl
)Mdl
.Mdl
必须是一个ClassificationBaggedensemble.
模型对象。
在使用随机森林时使用fitcensemble.
:
标准CART倾向于选择包含许多不同值(如连续变量)的分离预测因子,而不是包含很少不同值(如分类变量)的分离预测因子[3].如果预测器数据集是异构的,或者如果存在与其他变量相对较少的不同值的预测器,则考虑指定曲率或交互测试。
使用标准CART生长的树木对预测变量相互作用不敏感。此外,与交互测试的应用相比,在存在许多无关的预测因子时,这种树不太可能识别出重要的变量。因此,为了解释预测变量之间的交互作用,并在存在许多不相关变量的情况下识别重要变量,指定交互作用检验[2].
如果培训数据包括许多预测因子并且您想要分析预测的重要性,则指定'numvariablestosample'
的Templatetree.
功能“所有”
对于合奏的树学习者。否则,软件可能无法选择一些预测器,低估了他们的重要性。
有关更多详细信息,请参阅Templatetree.
和选择分割预测器选择技术.
[1] Breiman,L.,J.Friedman,R. Olshen和C. Stone。分类与回归树.佛罗里达州博卡拉顿:CRC出版社,1984。
[2] LOH,W.Y.“具有无偏的变量选择和相互作用检测的回归树。”STATISTICA SINICA., 2002年第12卷,第361-386页。
Loh w.y y and Y.S. Shih分类树的分裂选择方法STATISTICA SINICA.,卷。7,1997,第815-840页。