主要内容

predictorImportance

为回归估计预测重要的树

语法

小鬼= predictorImportance(树)

描述

小鬼= predictorImportance ()计算估计预测的重要性通过总结均方误差的变化将在每一个预测和分裂之和除以分支节点的数量。

输入参数

回归树了fitrtree紧凑的方法。

输出参数

小鬼

一个行向量与相同数量的元素数量预测(列)。X。条目的估计预测的重要性,0代表最小的重要性。

例子

全部展开

估计所有预测变量的数据预测的重要性。

加载carsmall数据集。

负载carsmall

回归树生长英里/加仑使用加速度,气缸,位移,马力,Model_Year,重量为预测因子。

X =(加速汽缸位移马力Model_Year重量);树= fitrtree (X, MPG);

估计所有预测变量预测的重要性。

小鬼= predictorImportance(树)
小鬼=1×60.0647 0.1068 0.1155 0.1411 0.3348 2.6565

重量最后预测,最影响里程。影响最小的因素在预测是第一个变量,这是加速度

估计所有变量的预测重要的数据和回归树包含代理分裂。

加载carsmall数据集。

负载carsmall

回归树生长英里/加仑使用加速度,气缸,位移,马力,Model_Year,重量为预测因子。指定识别代理分裂。

X =(加速汽缸位移马力Model_Year重量);树= fitrtree (X,英里/加仑,“代孕”,“上”);

估计所有预测变量预测的重要性。

小鬼= predictorImportance(树)
小鬼=1×61.0449 2.4560 2.5570 2.5788 2.0832 2.8938

比较小鬼结果在估计预测的重要性,重量还有最影响里程,但是气缸第四最重要的预测因子。

加载carsmall数据集。考虑一个模型,预测的平均燃油经济性汽车由于其加速度,缸数,发动机排量,马力,制造商,模型,和体重。考虑气缸,制造行业,Model_Year作为分类变量。

负载carsmall气缸=分类(缸);及时通知=分类(cellstr (Mfg));Model_Year =分类(Model_Year);X =表(加速、气缸、排量、马力、制造行业,Model_Year、重量、MPG);

显示类别的数量代表的分类变量。

numCylinders =元素个数(类别(气缸))
numCylinders = 3
numMfg =元素个数(类别(有限公司))
numMfg = 28
numModelYear =元素个数(类别(Model_Year))
numModelYear = 3

因为只有在有三个类别气缸Model_Year标准车,predictor-splitting算法更喜欢将连续预测这两个变量。

火车回归树使用整个数据集。无偏树木生长,指定使用曲率检测分割预测。因为有数据缺失值,指定使用代理分裂。

Mdl = fitrtree (X,“英里”,“PredictorSelection”,“弯曲”,“代孕”,“上”);

估计预测重要性值通过加法的变化风险将在每一个预测和分裂之和除以分支节点的数量。使用条形图比较估计。

小鬼= predictorImportance (Mdl);图;酒吧(imp);标题(的预测估计的重要性);ylabel (“估计”);包含(“预测”);甘氨胆酸h =;h。XTickLabel = Mdl.PredictorNames;h。XTickLabelRotation = 45;h。TickLabelInterpreter =“没有”;

图包含一个坐标轴对象。坐标轴对象标题预测重要性估计包含一个对象类型的酒吧。

在这种情况下,位移是最重要的因素,其次是吗马力

更多关于

全部展开

扩展功能