predictorImportance
计算重要性措施的预测在树上求和节点的变化风险由于分裂每个预测,然后之和除以总数量的分支节点。节点的变化风险的区别是风险的父节点和总风险两个孩子。例如,如果一个树分裂一个父节点(例如,节点1)为两个子节点(例如,节点2和3)predictorImportance
增加分割预测的重要性
(R1- - - - - -R2- - - - - -R3)/N分支,
在哪里R我节点的风险节点吗我,N分支分支节点的总数。一个节点的风险被定义为一个节点错误概率加权的节点:
在哪里P我节点的概率节点吗我,E我节点的平均平方误差我。
预测估计的重要性取决于你使用代理将进行训练。
如果您使用代理分裂,predictorImportance
总结节点风险所有分裂的变化在每个分支节点,包括代理分裂。如果不使用代理分裂,那么函数求和最好的分裂在每个分支节点。
估计预测的重要性不依赖于预测如果你使用代理分裂的顺序,但取决于订单如果不使用代理分裂。
如果您使用代理分裂,predictorImportance
计算估计减少修剪树之前(或合并的叶子)。如果不使用代理分裂,predictorImportance
计算估计减少修剪树后。因此,修剪影响因素重要性的树的种植过程中没有使用代理分裂,并且不影响预测的重要性与代理分裂树生长。