RegressionTree类

超类:CompactRegressionTree

回归树

描述

决策树与二元分裂回归。一个类的对象RegressionTree可以预测反应的新数据预测方法。对象包含数据用于训练,所以可以计算resubstitution预测。

建设

创建一个RegressionTree对象的使用fitrtree。

属性

`BinEdges`	本数值预测边缘,指定的单元阵列p数值向量,p预测的数量。每个向量包括箱子边缘数值预测。单元阵列中的元素分类预测是空的,因为软件不本分类预测。软件垃圾箱只有指定数值预测`“NumBins”`名称-值参数作为一个正整数标量当训练学习者模型树。的`BinEdges`属性是空的,如果`“NumBins”`值是空的(默认)。你可以复制被预测数据`Xbinned`通过使用`BinEdges`训练模型的属性`mdl`。 X = mdl.X;%预测数据Xbinned = 0(大小(X));边缘= mdl.BinEdges;%找到被预测的指标。idxNumeric =找到(~ cellfun (@isempty边缘));如果iscolumn idxNumeric idxNumeric = idxNumeric ';对j = idxNumeric x = x (:, j);% x转换为数组如果x是一个表。如果istable (x) x = table2array (x);组x %到垃圾箱使用结束`离散化`函数。xbinned =离散化(x,[无穷;边缘{};正]);Xbinned (:, j) = Xbinned;结束 `Xbinned`包含本指标,从1到垃圾箱的数量,数值预测。`Xbinned`分类预测的值是0。如果`X`包含`南`年代,那么相应的`Xbinned`值是`南`年代。
`CategoricalPredictors`	分类预测指标,指定为一个向量的正整数。`CategoricalPredictors`包含索引值表明相应的预测分类。索引值介于1和`p`,在那里`p`预测的数量被用来训练模型。如果所有的预测都直言,那么这个属性是空的(`[]`)。
`CategoricalSplit`	一个n2单元阵列,`n`是绝对的数量将在吗`树`。在每一行`CategoricalSplit`给左和右值分类分裂。为每个分支节点与分类`j`基于分类预测变量`z`选择,左边的孩子`z`是在`CategoricalSplit (j, 1)`和孩子选择`z`是在`CategoricalSplit (j, 2)`。分裂在同一个订单的节点树。节点对这些分歧可以通过运行中找到`cuttype`并选择`“分类”`从上到下。
`孩子们`	一个n2数组包含每个节点的子节点的数量`树`,在那里n节点的数量。叶节点有子节点`0`。
`CutCategories`	一个n2单元阵列在分支机构使用的类别`树`,在那里n节点的数量。为每个分支节点`我`基于分类预测变量`x`选择,左边的孩子`x`在列出的类别吗`CutCategories{1},我`选择,正确的孩子`x`中列出的那些吗`CutCategories{2},我`。这两列的`CutCategories`是空的基于连续预测分支节点和叶节点。 `割点`包含切割点`“连续”`削减,`CutCategories`包含的集合类。
`割点`	一个n元向量的值用作切割点`树`,在那里n节点的数量。为每个分支节点`我`基于连续的预测变量`x`选择,左边的孩子`x <割点(我)`和孩子选择`x > =割点(我)`。`割点`是`南`基于分类预测的分支节点和叶节点。
`CutType`	一个n元胞数组表示将在每个节点的类型`树`,在那里n节点的数量。为每个节点`我`,`CutType{我}`是: `“连续”`——如果伤口中定义的形式`x < v`为一个变量`x`和减少点`v`。 `“分类”`——如果将被定义为一个变量`x`以一组类别的一个值。 `”`——如果`我`是一个叶子节点。 `割点`包含切割点`“连续”`削减,`CutCategories`包含的集合类。
`CutPredictor`	一个n元胞数组的变量的名称用于分支在每个节点`树`,在那里n节点的数量。这些变量有时被称为减少变量。叶节点,`CutPredictor`包含一个空的特征向量。 `割点`包含切割点`“连续”`削减,`CutCategories`包含的集合类。
`CutPredictorIndex`	一个n使用有效的数字索引数组变量中每个节点的分支`树`,在那里n节点的数量。有关更多信息,请参见`CutPredictor`。
`ExpandedPredictorNames`	扩展预测名称,存储单元阵列的特征向量。如果分类变量的模型使用的编码,那么`ExpandedPredictorNames`包括名称,描述变量扩展。否则,`ExpandedPredictorNames`是一样的`PredictorNames`。
`HyperparameterOptimizationResults`	描述hyperparameters交叉验证优化的存储为一个`BayesianOptimization`对象或一个表hyperparameters和相关联的值。非空的时`OptimizeHyperparameters`名称-值对非空的创造。价值取决于的设置`HyperparameterOptimizationOptions`名称-值对在创建: `“bayesopt”`(默认)——对象的类`BayesianOptimization` `“gridsearch”`或`“randomsearch”`——hyperparameters表使用,观察目标函数值(交叉验证损失)和从最低(最好的)最高等级的观察(坏的)
`IsBranchNode`	一个n元逻辑向量`ib`这是`真正的`为每个节点和分支`假`为每一个叶子节点`树`。
`ModelParameters`	对象持有的参数`树`。
`NumObservations`	在训练数据的观察,一个数字标量。`NumObservations`可以小于输入数据的行数`X`当有缺失值`X`或响应`Y`。
`NodeError`	一个n元向量`e`错误的节点`树`,在那里n节点的数量。`e(我)`是节点的均方误差`我`。
`NodeMean`	一个n元数值数组中每个节点的平均值`树`,在那里n是在树上的节点数量。每一个元素`NodeMean`的平均值是真的吗`Y`对所有观察值的节点。
`NodeProbability`	一个n元向量`p`节点的概率`树`,在那里n节点的数量。一个节点的概率计算的比例从原始观测数据,满足条件的节点。
`NodeRisk`	一个n元向量的风险树中的节点,在哪里n节点的数量。每个节点的风险是由节点的节点误差加权的概率。
`NodeSize`	一个n元向量`大小`的节点的大小`树`,在那里n节点的数量。大小的一个节点被定义为观测的数量从数据用来创建树节点满足条件。
`NumNodes`	节点的数量`n`在`树`。
`父`	一个n元向量`p`包含每个节点的父节点的数量`树`,在那里n节点的数量。根节点的父节点`0`。
`PredictorNames`	一个单元阵列为预测变量的名称,在它们出现的顺序`X`。
`PruneAlpha`	每修剪水平数值向量和一个元素。如果修剪水平范围从0到米,然后`PruneAlpha`有米+ 1元素按升序排序。`PruneAlpha (1)`是修剪级别0(没有修剪),`PruneAlpha (2)`修剪水平1,等等。
`PruneList`	一个n元数值向量的每个节点修剪水平`树`,在那里n节点的数量。修剪水平范围从0(没有修剪)米,在那里米是最深的叶和根节点之间的距离。
`ResponseName`	一个特征向量指定响应变量的名称(`Y`)。
`ResponseTransform`	函数处理转换原始响应值(均方误差)。函数处理必须接受一个矩阵的响应值并返回一个相同大小的矩阵。默认的`“没有”`意味着`@ x (x)`,或者没有转换。添加或更改`ResponseTransform`函数使用点符号: 树。ResponseTransform = @函数
`RowsUsed`	一个n元逻辑向量表示哪些行最初的预测数据(`X`)被用于拟合。如果软件使用的所有行`X`,然后`RowsUsed`是一个空数组(`[]`)。
`SurrogateCutCategories`	一个n元胞数组的类别用于替代分裂`树`,在那里n节点的数量在吗`树`。为每个节点`k`,`SurrogateCutCategories {k}`是一个单元阵列。的长度`SurrogateCutCategories {k}`等于代理预测在这个节点的数量。每个元素的`SurrogateCutCategories {k}`要么是一个空的特征向量连续代理预测,或者是一个双元素单元阵列与类别分类代理预测。双元素单元阵列列表的第一个元素类别分配给这个代理分裂,左子和双元素单元阵列的第二个元素列表类别分配到正确的孩子通过这个代理。代孕的顺序分离变量在每个节点匹配变量的顺序`SurrogateCutPredictor`。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogateCutCategories`包含一个空单元。
`SurrogateCutFlip`	一个n元胞数组的数值减少作业用来替代分裂`树`,在那里n节点的数量在吗`树`。为每个节点`k`,`SurrogateCutFlip {k}`是一个数值向量。的长度`SurrogateCutFlip {k}`等于代理预测在这个节点的数量。每个元素的`SurrogateCutFlip {k}`零分类代理预测,或一个数字削减分配连续代理预测。数字减少作业可以是- 1或+ 1。对于每一个代理和一个数字C基于连续的预测变量Z选择,左边的孩子Z<C和削减分配代理分+ 1,或者Z≥C和这个代理的切割作业是1。同样,选择正确的孩子Z≥C和削减分配代理分+ 1,或者Z<C和这个代理的切割作业是1。代孕的顺序分离变量在每个节点匹配变量的顺序`SurrogateCutPredictor`。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogateCutFlip`包含一个空数组。
`SurrogateCutPoint`	一个n元胞数组的数值用于替代分裂`树`,在那里n节点的数量在吗`树`。为每个节点`k`,`SurrogateCutPoint {k}`是一个数值向量。的长度`SurrogateCutPoint {k}`等于代理预测在这个节点的数量。每个元素的`SurrogateCutPoint {k}`要么是`南`分类代理预测,或连续的数字减少代理预测。对于每一个代理和一个数字C基于连续的预测变量Z选择,左边的孩子Z<C和`SurrogateCutFlip`这个代理分+ 1,或者Z≥C和`SurrogateCutFlip`这个代理分裂是1。同样,选择正确的孩子Z≥C和`SurrogateCutFlip`这个代理分+ 1,或者Z<C和`SurrogateCutFlip`这个代理分裂是1。代孕的顺序分离变量在每个节点相匹配的顺序返回的变量`SurrCutPredictor`。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogateCutPoint`包含一个空单元。
`SurrogateCutType`	一个n元胞数组表示类型的代理将在每个节点`树`,在那里n节点的数量在吗`树`。为每个节点`k`,`SurrogateCutType {k}`是单元阵列类型的代理变量分裂在这个节点。预测的变量排序测量和最优预测降序排列,并仅包含了变量与积极的预测指标。代孕的顺序分离变量在每个节点匹配变量的顺序`SurrogateCutPredictor`。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogateCutType`包含一个空单元。代孕可以分裂类型`“连续”`如果削减中定义的形式`Z`<`V`为一个变量`Z`和减少点`V`或`“分类”`如果削减由是否定义`Z`以一组类别的一个值。
`SurrogateCutPredictor`	一个n元胞数组的变量的名称用于代理在每个节点分裂`树`,在那里n节点的数量在吗`树`。每个元素的`SurrogateCutPredictor`是一个单元阵列的名字在这个节点代理变量分裂。预测的变量排序测量和最优预测降序排列,并仅包含了变量与积极的预测指标。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogateCutPredictor`包含一个空单元。
`SurrogatePredictorAssociation`	一个n元胞数组的代理将协会的预测措施`树`,在那里n节点的数量在吗`树`。为每个节点`k`,`SurrogatePredictorAssociation {k}`是一个数值向量。的长度`SurrogatePredictorAssociation {k}`等于代理预测在这个节点的数量。每个元素的`SurrogatePredictorAssociation {k}`给出了预测的最优分割这代理分裂之间的联系。代孕的顺序分离变量在每个节点变量的顺序`SurrogateCutPredictor`。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogatePredictorAssociation`包含一个空单元。
`W`	的比例`权重`,一个向量的长度`n`的行数`X`。
`X`	一个矩阵或表的预测价值。每一列的`X`代表一个变量,每一行代表一个观察。
`Y`	一个数字列向量具有相同的行数`X`。中的每个条目`Y`应对数据在相应的行吗`X`。

对象的功能

`紧凑的`	紧凑的回归树
`crossval`	旨在决策树
`cvloss`	通过交叉验证回归误差
`收集`	收集的属性统计和机器学习工具对象从GPU
`石灰`	本地可model-agnostic解释(石灰)
`损失`	回归误差
`partialDependence`	计算部分依赖
`plotPartialDependence`	创建部分依赖图(PDP)和个人条件期望(ICE)情节
`预测`	预测使用回归树的反应
`predictorImportance`	为回归估计预测重要的树
`修剪`	产生的序列回归子树修剪
`resubLoss`	resubstitution回归错误的
`resubPredict`	预测resubstitution回应的树
`沙普利`	沙普利值
`surrogateAssociation`	意味着预测衡量代理协会将回归树
`视图`	视图回归树

复制语义

价值。学习如何价值类影响复制操作,明白了复制对象。

例子

全部折叠

构建回归树

打开生活的脚本

加载示例数据。

负载carsmall

使用样本数据构造一个回归树。响应变量是英里每加仑,英里/加仑。

树= fitrtree (MPG(重量、缸),…“CategoricalPredictors”2,“MinParentSize”,20岁,…“PredictorNames”,{' W ',“C”})

树= RegressionTree PredictorNames: {' W ' ' C '} ResponseName:“Y”CategoricalPredictors: 2 ResponseTransform:“没有一个”NumObservations: 94属性,方法

预测4000磅的里程汽车4、6和8缸。

MPG4Kpred =预测(树,(4000 4;4000 6;4000 8])

MPG4Kpred =3×119.2778 19.2778 14.3889

引用

[1]Breiman, L。,J. Friedman, R. Olshen, and C. Stone.分类和回归树。波卡拉顿,FL: CRC出版社,1984年。

扩展功能

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

使用笔记和限制:

的预测和更新代码生成功能支持。金宝app
将回归树模型的预测模型金宝app^®,你可以使用RegressionTree预测块的统计和机器学习的图书馆或MATLAB工具箱™^®功能块的预测函数。
当你训练一个回归树模型通过使用fitrtree以下限制适用。
- 的值“ResponseTransform”名称-值对论点必须“没有”(默认)。
- 你不能使用代理分裂,的值“代孕”名称-值对论点必须“关闭”。
- 定点代码生成和代码生成与编码器配置不支持分类预测(金宝app逻辑,分类,字符,字符串,或细胞)。你不能使用“CategoricalPredictors”名称-值参数。包括分类预测模型中,利用预处理dummyvar在拟合模型。