回归课堂

超类：Compactregressiontree.

回归树

展开所有页面

描述

具有二进制拆分的决策树以用于回归。课堂对象回归植物可以预测新数据的响应预测方法。该对象包含用于培训的数据，因此可以计算重新提交预测。

建造

创建一个回归植物通过使用fitrtree.。

特性

`毕业生`	数字预测器的Bin边缘，指定为单元数组P.数字向量，在哪里P.是预测器的数量。每个矢量包括用于数字预测器的箱边缘。用于分类预测器的单元阵列中的元素是空的，因为软件没有箱分类预测器。只有在指定的情况下，软件箱体才能指定数字预测器`'numbins'`名称 - 值对参数作为正整数标量培训与树学习者的模型。这`毕业生`房产是空的`'numbins'`值为空（默认值）。您可以重现Binned Predictor数据`Xbinned.`通过使用`毕业生`培训模型的财产`MDL.`。 x = mdl.x;％predictor数据xbinned = zeros（size（x））;边缘= mdl.bineges;％查找箱预测因子的指数。idxnumeric = find（〜cellfun（@ isempty，边））;如果是iscumn（idxnumeric）idxnumeric = idxnumeric';j = idxnumeric x = x（：，j）;如果x是表，％将x转换为数组。如果是Istable（x）x = table2array（x）;结束％X通过使用X进入垃圾箱`离散化`功能。xbinned =离散化（x，[ - inf;边缘{j}; inf]）;Xbinned（：，j）= xbinned;结尾 `Xbinned.`包含单位，范围为1到箱数，用于数字预测器。`Xbinned.`对于分类预测器，值为0。如果`X`包含`南`s，然后相应的`Xbinned.`价值是`南`s。
`分类预测器`	分类预测索引指定为正整数的向量。`分类预测器`包含与包含分类预测器的预测器数据列对应的索引值。如果没有预测器都是分类的，则此属性是空的（`[]`）。
`分类浮点`	一个N- 2个单元格阵列，其中`N`是分类分裂的数量`树`。每一行`分类浮点`为分类拆分提供左和右值。对于具有分类拆分的每个分支节点`j`基于分类预测变量`Z.`，如果是，则选择左子子`Z.`是`类别plits（J，1）`并且如果是选择合适的孩子`Z.`是`类别plits（J，2）`。拆分与树的节点相同。可以通过运行找到这些拆分的节点`cuttype.`并选择`'分类'`从上到下切割。
`孩子们`	一个N-By-2数组，包含每个节点的子节点的数字`树`，在哪里N是节点的数量。叶节点有子节点`0.`。
`cut类别`	一个N- 在分支机构中使用的类别的2个单元格阵列`树`，在哪里N是节点的数量。对于每个分支节点`一世`基于分类预测变量`X`，如果是，则选择左子子`X`是列出的类别`cutcategories {i，1}`如果如果是，则选择合适的孩子`X`是列出的那些`Cutcategories {I，2}`。这两列`cut类别`基于连续预测器和叶节点的分支节点为空。 `切口`包含切割点`'连续的'`削减和`cut类别`包含一组类别。
`切口`	一个N-Element矢量的矢量作为切割点`树`，在哪里N是节点的数量。对于每个分支节点`一世`基于连续的预测变量`X`，如果是，则选择左子子`x 并且如果是选择合适的孩子x> =切口（i）。切口是南对于基于分类预测器和叶节点的分支节点。`
`cuttype.`	一个N-Element Cell阵列，指示每个节点处的切口类型`树`，在哪里N是节点的数量。对于每个节点`一世`那`cuttype {i}`是： `'连续的'`- 如果剪切在表单中定义`X 对于变量X和切割点V.。` `'分类'- 如果切割是由变量定义的X在一组类别中取得一个值。 ''- 如果一世是叶节点。` `切口包含切割点'连续的'削减和cut类别包含一组类别。`
`Cutpredictor.`	一个N- 用于在每个节点中用于分支的变量的名称的单元格数组`树`，在哪里N是节点的数量。这些变量有时被称为切变量。对于叶节点，`Cutpredictor.`包含一个空字符向量。 `切口`包含切割点`'连续的'`削减和`cut类别`包含一组类别。
`cutpredictorindex.`	一个N- 用于在每个节点中用于分支的变量的数字索引数组`树`，在哪里N是节点的数量。有关更多信息，请参阅`Cutpredictor.`。
`ExpandedPredictorNames.`	扩展的预测器名称，存储为字符向量的单元格数组。如果模型使用对分类变量的编码，那么`ExpandedPredictorNames.`包括描述扩展变量的名称。除此以外，`ExpandedPredictorNames.`是相同的`预测`。
`HyperParameterOptimationResults.`	超参数的交叉验证优化的描述，存储为a`贝叶斯偏见`对象或超参数和关联值表。否定的时候`优化hyperParameters.`名称 - 值对在创建时是非空的。价值取决于设置的设置`HyperParameterOptimizationOptions.`创建中的名称 - 值对： `'Bayesopt'`（默认） - 类的对象`贝叶斯偏见` `'gridsearch'`或者`'randomsearch'`- 使用的超参数表，观察到的目标函数值（交叉验证丢失），以及从最低（最佳）到最高（最差）的观察等级
`Isbranchnode.`	一个N-element逻辑矢量`IB.`那是`真的`对于每个分支节点和`错误的`对于每个叶节点`树`。
`模特分析者`	持有参数的对象`树`。
`numobservations.`	训练数据中的观察数，数字标量。`numobservations.`可以小于输入数据的行数`X`当存在缺失的值时`X`或反应`y`。
`nodeerror.`	一个N-Element矢量`E.`节点的错误`树`，在哪里N是节点的数量。`E（i）`是节点的错误分类概率`一世`。
`寡码`	一个N-element数字数组，每个节点中的平均值`树`，在哪里N是树中的节点数量。每个元素`寡码`是真实的平均值`y`在节点中的所有观察结果上的值。
`nodeProbability.`	一个N-Element矢量`P.`节点的概率`树`，在哪里N是节点的数量。节点的概率被计算为来自满足节点条件的原始数据的观测的比例。针对分配给每个类的任何先前概率调整此比例。
`Noderisk.`	一个N-element vector的树是树中的节点的风险，其中N是节点的数量。每个节点的风险是节点概率加权的节点错误。
`节点化`	一个N-Element矢量`尺寸`节点的大小`树`，在哪里N是节点的数量。节点的大小被定义为来自用于创建满足节点条件的树的数据的观察次数。
`numnodes.`	节点数量`N`在`树`。
`父母`	一个N-Element矢量`P.`包含每个节点的父节点的数量`树`，在哪里N是节点的数量。根节点的父级是`0.`。
`预测`	预测器变量的一个小区数组，按照它们出现的顺序`X`。
`Prunealpha.`	数值矢量与每个修剪水平的一个元素。如果修剪级别范围为0到m，然后`Prunealpha.`具有m+ 1个元素按升序排序。`Prunealpha（1）`是用于修剪水平0（没有修剪），`Prunealpha（2）`用于修剪1级，等等。
`梅尔格莱斯`	一个N-element数字矢量与每个节点的修剪级别`树`，在哪里N是节点的数量。修剪水平范围为0（无修剪）m，在哪里m是最深叶和根节点之间的距离。
`ractraceame.`	一个字符向量，指定响应变量的名称（`y`）。
`OrkeTransform.`	用于转换原始响应值的功能手柄（均方误差）。函数句柄必须接受响应值的矩阵并返回相同大小的矩阵。默认值`'没有任何'`方法`@（x）x`，或没有转型。添加或更改`OrkeTransform.`使用点表示法的功能： tree.responsetransform = @功能
`流浪`	一个N-element逻辑矢量，指示原始预测器数据的哪一行（`X`）用于配件。如果软件使用所有行`X`，然后`流浪`是一个空数组（`[]`）。
`surrogatecutcategories.`	一个N- 用于代理分裂的类别的单元格阵列`树`，在哪里N是节点的数量`树`。对于每个节点`K.`那`surrogatecutcategories {k}`是一个小区阵列。长度`surrogatecutcategories {k}`等于此节点上发现的代理预测器的数量。每个元素`surrogatecutcategories {k}`是连续代理预测器的空字符向量，或者是一个双元素单元数组，其中包含分类代理预测器的类别。这种双元素单元阵列的第一个元素列出了由此代理拆分分配给左子子的类别，以及该两个元素单元格阵列的第二个元素通过该代理拆分分配给右子的类别。每个节点处的代理分割变量的顺序与变量顺序匹配`surrogatecutprepictor.`。不会出现此节点处的最佳分割变量。对于非支链（叶）节点，`surrogatecutcategories.`包含空的小区。
`surrogatecutflip.`	一个N- 用于代理分割的数字切割分配的元素阵列`树`，在哪里N是节点的数量`树`。对于每个节点`K.`那`surrogatecutflip {k}`是数字矢量。长度`surrogatecutflip {k}`等于此节点上发现的代理预测器的数量。每个元素`surrogatecutflip {k}`用于分类代理预测器的零，或用于连续代理预测器的数字切割分配。数字切割分配可以是-1或+1。对于每个替代品分裂，用数字剪切C基于连续的预测变量Z.，如果是，则选择左子子Z.<C和此代理拆分的切割分配是+1，或者如果Z.≥C而这个替代拆分的切割分配是-1。同样，如果选择合适的孩子Z.≥C和此代理拆分的切割分配是+1，或者如果Z.<C而这个替代拆分的切割分配是-1。每个节点处的代理分割变量的顺序与变量顺序匹配`surrogatecutprepictor.`。不会出现此节点处的最佳分割变量。对于非支链（叶）节点，`surrogatecutflip.`包含一个空数组。
`surrogatecutpoint.`	一个N- 用于代理分裂的数值的单个单元阵列`树`，在哪里N是节点的数量`树`。对于每个节点`K.`那`surrogatecutpoint {k}`是数字矢量。长度`surrogatecutpoint {k}`等于此节点上发现的代理预测器的数量。每个元素`surrogatecutpoint {k}`或者是`南`对于分类代理预测器，或用于连续代理预测器的数字切割。对于每个替代品分裂，用数字剪切C基于连续的预测变量Z.，如果是，则选择左子子Z.<C和`surrogatecutflip.`对于这个替代品拆分是+1，或者如果Z.≥C和`surrogatecutflip.`对于这个替代斯普利特是-1。同样，如果选择合适的孩子Z.≥C和`surrogatecutflip.`对于这个替代品拆分是+1，或者如果Z.<C和`surrogatecutflip.`对于这个替代斯普利特是-1。每个节点处的替代分类变量的顺序与返回的变量顺序匹配`surrcutpricictor`。不会出现此节点处的最佳分割变量。对于非支链（叶）节点，`surrogatecutpoint.`包含空的小区。
`surrogatecuttype.`	一个N-element小区阵列，指示每个节点处的代理分裂类型`树`，在哪里N是节点的数量`树`。对于每个节点`K.`那`surrogatecuttype {k}`是一个单元数组，具有此节点的代理分割变量的类型。通过以降序的最佳预测器的相关性的预测度量来排序变量，并且仅包括具有阳性预测度量的变量。每个节点处的代理分割变量的顺序与变量顺序匹配`surrogatecutprepictor.`。不会出现此节点处的最佳分割变量。对于非支链（叶）节点，`surrogatecuttype.`包含空的小区。代理分裂类型可以是`'连续的'`如果剪切在表单中定义`Z.`<`V.`对于变量`Z.`和切割点`V.`或者`'分类'`如果切割是由是否定义的`Z.`在一组类别中取得一个值。
`surrogatecutprepictor.`	一个N- 用于在每个节点中用于代理拆分的变量的名称的单元阵列`树`，在哪里N是节点的数量`树`。每个元素`surrogatecutprepictor.`是一个单元数组，具有此节点的代理分割变量的名称。通过以降序的最佳预测器的相关性的预测度量来排序变量，并且仅包括具有阳性预测度量的变量。不会出现此节点处的最佳分割变量。对于非支链（叶）节点，`surrogatecutprepictor.`包含空的小区。
`替代商品orassociation.`	一个N-Element Cell阵列的代理分裂关联的预测措施`树`，在哪里N是节点的数量`树`。对于每个节点`K.`那`替代商品报gRedicorAssociation{k}`是数字矢量。长度`替代商品报gRedicorAssociation{k}`等于此节点上发现的代理预测器的数量。每个元素`替代商品报gRedicorAssociation{k}`给出了最佳分裂与此代理分裂之间的关联的预测措施。每个节点处的替代分类变量的顺序是变量的顺序`surrogatecutprepictor.`。不会出现此节点处的最佳分割变量。对于非支链（叶）节点，`替代商品orassociation.`包含空的小区。
`W.`	鳞片`重量`，长度的矢量`N`，行的数量`X`。
`X`	预测值的矩阵或表格。每列`X`表示一个变量，每行代表一个观察。
`y`	数字列向量，具有相同的行数为`X`。每个条目`y`是对相应行中的数据的响应`X`。

对象功能

`袖珍的`	紧凑的回归树
`横梁`	交叉验证的决策树
`cvloss.`	交叉验证的回归误差
`失利`	回归错误
`部分竞争`	计算部分依赖
`绘图竞争依赖性`	创建部分依赖图（PDP）和个人有条件期望（ICE）情节
`预测`	使用回归树预测响应
`预测的重要性`	对回归树预测的重要性估计
`修剪`	通过修剪产生回归子树的序列
`resubloss.`	Resubstion的回归错误
`重新预订`	预测树的重生答反应
`Trustogateassociation.`	回归树中替代分裂关联关联的平均预测措施
`看法`	查看回归树

复制语义

价值。要了解值类如何影响复制操作，请参阅复制对象。

例子

全部收缩

构建回归树

打开直播脚本

加载样本数据。

加载Carsmall.

使用示例数据构造回归树。响应变量是每加仑，MPG的数英里。

Tree = FitRtree（[重量，圆柱体]，MPG，......'pationoricalpricictors'2，'迷人'20，......'predictornames'，{'W'那'C'}）

Tree = RegressionTree Predictornames：{'W'C'} ResponseName：'y'类分类：2 responsefransform：'none'numobservations：94属性，方法

预测4,000磅汽车的里程，有4,6和8个气缸。

MPG4kpred =预测（树，[4000 4; 4000 6; 4000 8]）

mpg4kpred =3×119.2778 19.2778 14.3889

参考

[1] Breiman，L.，J.Friedman，R. Olshen和C. Stone。分类和回归树。Boca Raton，FL：CRC Press，1984。

扩展能力

C / C ++代码生成
使用MATLAB®Coder™生成C和C ++代码。

使用说明和限制：

这预测和更新功能支持代码生成。金宝app
使用使用时培训回归树模型fitrtree.，以下限制适用。
- 代码生成不支持分类预测器（金宝app逻辑那分类那char那细绳，或者细胞）。如果在表中提供培训数据，则预测器必须是数字（双倍的或者单身的）。此外，你不能使用'pationoricalpricictors'名称值对参数。要在模型中包含分类预测器，请通过使用预处理分类预计戴维尔在拟合模型之前。
- 价值'OrkeTransform'名称 - 值对参数不能是匿名函数。对于固定点代码生成，'OrkeTransform'价值必须是'没有任何'。
- 你不能使用代理分裂，即'代理'名称值对参数必须是'离开'。