predictorImportance
计算树中预测器的重要性度量,方法是将每个预测器分裂后的节点风险变化相加,然后除以分支节点的总数。节点风险的变化是父节点的风险与两个子节点的总风险之间的差异。例如,如果一棵树将父节点(例如节点1)分解为两个子节点(例如节点2和3),则predictorImportance
增加分裂预测器的重要性
(R1- - - - - -R2- - - - - -R3./N分支,
在哪里R我节点是否存在节点风险我, 和N分支是分支节点的总数。一种节点的风险被定义为节点概率加权的节点错误或节点杂质:
在哪里P我是节点的概率吗我, 和E我是节点错误(对于通过最小化倒挂标准而生长的树)或节点杂质(用于通过最小化节点的杂质标准而生长的树,例如通过节点的基尼索引或偏差)我.
预测器重要性的估计取决于您是否在训练中使用代理分割。