主要内容

回归课堂

超类:Compactregressiontree.

回归树

描述

具有二进制拆分的决策树以用于回归。课堂对象回归植物可以预测新数据的响应预测方法。该对象包含用于培训的数据,因此可以计算重新提交预测。

建造

创建一个回归植物通过使用fitrtree.

特性

毕业生

数字预测器的Bin边缘,指定为单元数组P.数字向量,在哪里P.是预测器的数量。每个矢量包括用于数字预测器的箱边缘。用于分类预测器的单元阵列中的元素是空的,因为软件没有箱分类预测器。

只有在指定的情况下,软件箱体才能指定数字预测器'numbins'名称 - 值对参数作为正整数标量培训与树学习者的模型。这毕业生房产是空的'numbins'值为空(默认值)。

您可以重现Binned Predictor数据Xbinned.通过使用毕业生培训模型的财产MDL.

x = mdl.x;%predictor数据xbinned = zeros(size(x));边缘= mdl.bineges;%查找箱预测因子的指数。idxnumeric = find(〜cellfun(@ isempty,边));如果是iscumn(idxnumeric)idxnumeric = idxnumeric';j = idxnumeric x = x(:,j);如果x是表,%将x转换为数组。如果是Istable(x)x = table2array(x);结束%X通过使用X进入垃圾箱离散化功能。xbinned =离散化(x,[ -  inf;边缘{j}; inf]);Xbinned(:,j)= xbinned;结尾
Xbinned.包含单位,范围为1到箱数,用于数字预测器。Xbinned.对于分类预测器,值为0。如果X包含s,然后相应的Xbinned.价值是s。

分类预测器

分类预测索引指定为正整数的向量。分类预测器包含与包含分类预测器的预测器数据列对应的索引值。如果没有预测器都是分类的,则此属性是空的([])。

分类浮点

一个N- 2个单元格阵列,其中N是分类分裂的数量。每一行分类浮点为分类拆分提供左和右值。对于具有分类拆分的每个分支节点j基于分类预测变量Z.,如果是,则选择左子子Z.类别plits(J,1)并且如果是选择合适的孩子Z.类别plits(J,2)。拆分与树的节点相同。可以通过运行找到这些拆分的节点cuttype.并选择'分类'从上到下切割。

孩子们

一个N-By-2数组,包含每个节点的子节点的数字, 在哪里N是节点的数量。叶节点有子节点0.

cut类别

一个N- 在分支机构中使用的类别的2个单元格阵列, 在哪里N是节点的数量。对于每个分支节点一世基于分类预测变量X,如果是,则选择左子子X是列出的类别cutcategories {i,1}如果如果是,则选择合适的孩子X是列出的那些Cutcategories {I,2}。这两列cut类别基于连续预测器和叶节点的分支节点为空。

切口包含切割点'连续的'削减和cut类别包含一组类别。

切口

一个N-Element矢量的矢量作为切割点, 在哪里N是节点的数量。对于每个分支节点一世基于连续的预测变量X,如果是,则选择左子子x 并且如果是选择合适的孩子x> =切口(i)切口对于基于分类预测器和叶节点的分支节点。

cuttype.

一个N-Element Cell阵列,指示每个节点处的切口类型, 在哪里N是节点的数量。对于每个节点一世cuttype {i}是:

  • '连续的'- 如果剪切在表单中定义X 对于变量X和切割点V.

  • '分类'- 如果切割是由变量定义的X在一组类别中取得一个值。

  • ''- 如果一世是叶节点。

切口包含切割点'连续的'削减和cut类别包含一组类别。

Cutpredictor.

一个N- 用于在每个节点中用于分支的变量的名称的单元格数组, 在哪里N是节点的数量。这些变量有时被称为切变量。对于叶节点,Cutpredictor.包含一个空字符向量。

切口包含切割点'连续的'削减和cut类别包含一组类别。

cutpredictorindex.

一个N- 用于在每个节点中用于分支的变量的数字索引数组, 在哪里N是节点的数量。有关更多信息,请参阅Cutpredictor.

ExpandedPredictorNames.

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型使用对分类变量的编码,那么ExpandedPredictorNames.包括描述扩展变量的名称。除此以外,ExpandedPredictorNames.是相同的预测

HyperParameterOptimationResults.

超参数的交叉验证优化的描述,存储为a贝叶斯偏见对象或超参数和关联值表。否定的时候优化hyperParameters.名称 - 值对在创建时是非空的。价值取决于设置的设置HyperParameterOptimizationOptions.创建中的名称 - 值对:

  • 'Bayesopt'(默认) - 类的对象贝叶斯偏见

  • 'gridsearch'或者'randomsearch'- 使用的超参数表,观察到的目标函数值(交叉验证丢失),以及从最低(最佳)到最高(最差)的观察等级

Isbranchnode.

一个N-element逻辑矢量IB.那是真的对于每个分支节点和错误的对于每个叶节点

模特分析者

持有参数的对象

numobservations.

训练数据中的观察数,数字标量。numobservations.可以小于输入数据的行数X当存在缺失的值时X或反应y

nodeerror.

一个N-Element矢量E.节点的错误, 在哪里N是节点的数量。E(i)是节点的错误分类概率一世

寡码

一个N-element数字数组,每个节点中的平均值, 在哪里N是树中的节点数量。每个元素寡码是真实的平均值y在节点中的所有观察结果上的值。

nodeProbability.

一个N-Element矢量P.节点的概率, 在哪里N是节点的数量。节点的概率被计算为来自满足节点条件的原始数据的观测的比例。针对分配给每个类的任何先前概率调整此比例。

Noderisk.

一个N-element vector的树是树中的节点的风险,其中N是节点的数量。每个节点的风险是节点概率加权的节点错误。

节点化

一个N-Element矢量尺寸节点的大小, 在哪里N是节点的数量。节点的大小被定义为来自用于创建满足节点条件的树的数据的观察次数。

numnodes.

节点数量N

父母

一个N-Element矢量P.包含每个节点的父节点的数量, 在哪里N是节点的数量。根节点的父级是0.

预测

预测器变量的一个小区数组,按照它们出现的顺序X

Prunealpha.

数值矢量与每个修剪水平的一个元素。如果修剪级别范围为0到m, 然后Prunealpha.具有m+ 1个元素按升序排序。Prunealpha(1)是用于修剪水平0(没有修剪),Prunealpha(2)用于修剪1级,等等。

梅尔格莱斯

一个N-element数字矢量与每个节点的修剪级别, 在哪里N是节点的数量。修剪水平范围为0(无修剪)m, 在哪里m是最深叶和根节点之间的距离。

ractraceame.

一个字符向量,指定响应变量的名称(y)。

OrkeTransform.

用于转换原始响应值的功能手柄(均方误​​差)。函数句柄必须接受响应值的矩阵并返回相同大小的矩阵。默认值'没有任何'方法@(x)x,或没有转型。

添加或更改OrkeTransform.使用点表示法的功能:

tree.responsetransform = @功能

流浪

一个N-element逻辑矢量,指示原始预测器数据的哪一行(X)用于配件。如果软件使用所有行X, 然后流浪是一个空数组([])。

surrogatecutcategories.

一个N- 用于代理分裂的类别的单元格阵列, 在哪里N是节点的数量。对于每个节点K.surrogatecutcategories {k}是一个小区阵列。长度surrogatecutcategories {k}等于此节点上发现的代理预测器的数量。每个元素surrogatecutcategories {k}是连续代理预测器的空字符向量,或者是一个双元素单元数组,其中包含分类代理预测器的类别。这种双元素单元阵列的第一个元素列出了由此代理拆分分配给左子子的类别,以及该两个元素单元格阵列的第二个元素通过该代理拆分分配给右子的类别。每个节点处的代理分割变量的顺序与变量顺序匹配surrogatecutprepictor.。不会出现此节点处的最佳分割变量。对于非支链(叶)节点,surrogatecutcategories.包含空的小区。

surrogatecutflip.

一个N- 用于代理分割的数字切割分配的元素阵列, 在哪里N是节点的数量。对于每个节点K.surrogatecutflip {k}是数字矢量。长度surrogatecutflip {k}等于此节点上发现的代理预测器的数量。每个元素surrogatecutflip {k}用于分类代理预测器的零,或用于连续代理预测器的数字切割分配。数字切割分配可以是-1或+1。对于每个替代品分裂,用数字剪切C基于连续的预测变量Z.,如果是,则选择左子子Z.<C和此代理拆分的切割分配是+1,或者如果Z.C而这个替代拆分的切割分配是-1。同样,如果选择合适的孩子Z.C和此代理拆分的切割分配是+1,或者如果Z.<C而这个替代拆分的切割分配是-1。每个节点处的代理分割变量的顺序与变量顺序匹配surrogatecutprepictor.。不会出现此节点处的最佳分割变量。对于非支链(叶)节点,surrogatecutflip.包含一个空数组。

surrogatecutpoint.

一个N- 用于代理分裂的数值的单个单元阵列, 在哪里N是节点的数量。对于每个节点K.surrogatecutpoint {k}是数字矢量。长度surrogatecutpoint {k}等于此节点上发现的代理预测器的数量。每个元素surrogatecutpoint {k}或者是对于分类代理预测器,或用于连续代理预测器的数字切割。对于每个替代品分裂,用数字剪切C基于连续的预测变量Z.,如果是,则选择左子子Z.<Csurrogatecutflip.对于这个替代品拆分是+1,或者如果Z.Csurrogatecutflip.对于这个替代斯普利特是-1。同样,如果选择合适的孩子Z.Csurrogatecutflip.对于这个替代品拆分是+1,或者如果Z.<Csurrogatecutflip.对于这个替代斯普利特是-1。每个节点处的替代分类变量的顺序与返回的变量顺序匹配surrcutpricictor。不会出现此节点处的最佳分割变量。对于非支链(叶)节点,surrogatecutpoint.包含空的小区。

surrogatecuttype.

一个N-element小区阵列,指示每个节点处的代理分裂类型, 在哪里N是节点的数量。对于每个节点K.surrogatecuttype {k}是一个单元数组,具有此节点的代理分割变量的类型。通过以降序的最佳预测器的相关性的预测度量来排序变量,并且仅包括具有阳性预测度量的变量。每个节点处的代理分割变量的顺序与变量顺序匹配surrogatecutprepictor.。不会出现此节点处的最佳分割变量。对于非支链(叶)节点,surrogatecuttype.包含空的小区。代理分裂类型可以是'连续的'如果剪切在表单中定义Z.<V.对于变量Z.和切割点V.或者'分类'如果切割是由是否定义的Z.在一组类别中取得一个值。

surrogatecutprepictor.

一个N- 用于在每个节点中用于代理拆分的变量的名称的单元阵列, 在哪里N是节点的数量。每个元素surrogatecutprepictor.是一个单元数组,具有此节点的代理分割变量的名称。通过以降序的最佳预测器的相关性的预测度量来排序变量,并且仅包括具有阳性预测度量的变量。不会出现此节点处的最佳分割变量。对于非支链(叶)节点,surrogatecutprepictor.包含空的小区。

替代商品orassociation.

一个N-Element Cell阵列的代理分裂关联的预测措施, 在哪里N是节点的数量。对于每个节点K.替代商品报gRedicorAssociation{k}是数字矢量。长度替代商品报gRedicorAssociation{k}等于此节点上发现的代理预测器的数量。每个元素替代商品报gRedicorAssociation{k}给出了最佳分裂与此代理分裂之间的关联的预测措施。每个节点处的替代分类变量的顺序是变量的顺序surrogatecutprepictor.。不会出现此节点处的最佳分割变量。对于非支链(叶)节点,替代商品orassociation.包含空的小区。

W.

鳞片重量,长度的矢量N,行的数量X

X

预测值的矩阵或表格。每列X表示一个变量,每行代表一个观察。

y

数字列向量,具有相同的行数为X。每个条目y是对相应行中的数据的响应X

对象功能

袖珍的 紧凑的回归树
横梁 交叉验证的决策树
cvloss. 交叉验证的回归误差
失利 回归错误
部分竞争 计算部分依赖
绘图竞争依赖性 创建部分依赖图(PDP)和个人有条件期望(ICE)情节
预测 使用回归树预测响应
预测的重要性 对回归树预测的重要性估计
修剪 通过修剪产生回归子树的序列
resubloss. Resubstion的回归错误
重新预订 预测树的重生答反应
Trustogateassociation. 回归树中替代分裂关联关联的平均预测措施
看法 查看回归树

复制语义

价值。要了解值类如何影响复制操作,请参阅复制对象

例子

全部收缩

加载样本数据。

加载Carsmall.

使用示例数据构造回归树。响应变量是每加仑,MPG的数英里。

Tree = FitRtree([重量,圆柱体],MPG,......'pationoricalpricictors'2,'迷人'20,......'predictornames',{'W''C'})
Tree = RegressionTree Predictornames:{'W'C'} ResponseName:'y'类分类:2 responsefransform:'none'numobservations:94属性,方法

预测4,000磅汽车的里程,有4,6和8个气缸。

MPG4kpred =预测(树,[4000 4; 4000 6; 4000 8])
mpg4kpred =3×119.2778 19.2778 14.3889

参考

[1] Breiman,L.,J.Friedman,R. Olshen和C. Stone。分类和回归树。Boca Raton,FL:CRC Press,1984。

扩展能力

在R2011A介绍