预测对回归树木随机森林的禁止超预测性观测的排列的重要性估计
返回一个向量out- bag,通过排列估计预测器的重要性使用回归树的随机森林偶尔
= OobperMutedPredictorimportance(Mdl
)Mdl
.Mdl
必须是一个RegressionBaggedEnsemble
模型对象。
在使用随机森林时使用fitrensemble
:
标准CART倾向于选择包含许多不同值(如连续变量)的分离预测因子,而不是包含很少不同值(如分类变量)的分离预测因子[3].如果预测器数据集是异构的,或者如果存在的预测器具有比其他变量相对较少的不同值相对较少,则考虑指定曲率或交互测试。
使用标准CART生长的树木对预测变量相互作用不敏感。此外,与交互测试的应用相比,在存在许多无关的预测因子时,这种树不太可能识别出重要的变量。因此,为了解释预测变量之间的交互作用,并在存在许多不相关变量的情况下识别重要变量,指定交互作用检验[2].
如果培训数据包括许多预测因子,并且您想要分析预测值重要性,请指定'numvariablestosample'
的Templatetree.
功能“所有”
对于集合的树学习者。否则,该软件可能无法选择一些预测器,低估了他们的重要性。
有关更多详细信息,请参阅Templatetree.
和选择分割预测测量选择技术.
[1] Breiman,L.,J.Friedman,R. Olshen和C. Stone。分类与回归树.佛罗里达州博卡拉顿:CRC出版社,1984。
[2] LOH,W.Y.“回归树木具有无偏的变量选择和相互作用检测。”统计学日志, 2002年第12卷,第361-386页。
Loh w.y y and Y.S. Shih分类树的分裂选择方法统计学日志,卷。7,1997,第815-840页。