主要内容

RegressionTree类

超类:CompactRegressionTree

描述

决策树与二元分裂回归。一个类的对象RegressionTree可以预测反应的新数据预测方法。对象包含数据用于训练,所以可以计算resubstitution预测。

建设

创建一个RegressionTree对象的使用fitrtree

属性

BinEdges

本数值预测边缘,指定的单元阵列p数值向量,p预测的数量。每个向量包括箱子边缘数值预测。单元阵列中的元素分类预测是空的,因为软件不本分类预测。

软件垃圾箱只有指定数值预测“NumBins”名称-值参数作为一个正整数标量当训练学习者模型树。的BinEdges属性是空的,如果“NumBins”值是空的(默认)。

你可以复制被预测数据Xbinned通过使用BinEdges训练模型的属性mdl

X = mdl.X;%预测数据Xbinned = 0(大小(X));边缘= mdl.BinEdges;%找到被预测的指标。idxNumeric =找到(~ cellfun (@isempty边缘));如果iscolumn idxNumeric idxNumeric = idxNumeric ';对j = idxNumeric x = x (:, j);% x转换为数组如果x是一个表。如果istable (x) x = table2array (x);组x %到垃圾箱使用结束离散化函数。xbinned =离散化(x,[无穷;边缘{};正]);Xbinned (:, j) = Xbinned;结束
Xbinned包含本指标,从1到垃圾箱的数量,数值预测。Xbinned分类预测的值是0。如果X包含年代,那么相应的Xbinned值是年代。

CategoricalPredictors

分类预测指标,指定为一个向量的正整数。CategoricalPredictors包含索引值表明相应的预测分类。索引值介于1和p,在那里p预测的数量被用来训练模型。如果所有的预测都直言,那么这个属性是空的([])。

CategoricalSplit

一个n2单元阵列,n是绝对的数量将在吗。在每一行CategoricalSplit给左和右值分类分裂。为每个分支节点与分类j基于分类预测变量z选择,左边的孩子z是在CategoricalSplit (j, 1)和孩子选择z是在CategoricalSplit (j, 2)。分裂在同一个订单的节点树。节点对这些分歧可以通过运行中找到cuttype并选择“分类”从上到下。

孩子们

一个n2数组包含每个节点的子节点的数量,在那里n节点的数量。叶节点有子节点0

CutCategories

一个n2单元阵列在分支机构使用的类别,在那里n节点的数量。为每个分支节点基于分类预测变量x选择,左边的孩子x在列出的类别吗CutCategories{1},我选择,正确的孩子x中列出的那些吗CutCategories{2},我。这两列的CutCategories是空的基于连续预测分支节点和叶节点。

割点包含切割点“连续”削减,CutCategories包含的集合类。

割点

一个n元向量的值用作切割点,在那里n节点的数量。为每个分支节点基于连续的预测变量x选择,左边的孩子x <割点(我)和孩子选择x > =割点(我)割点基于分类预测的分支节点和叶节点。

CutType

一个n元胞数组表示将在每个节点的类型,在那里n节点的数量。为每个节点,CutType{我}是:

  • “连续”——如果伤口中定义的形式x < v为一个变量x和减少点v

  • “分类”——如果将被定义为一个变量x以一组类别的一个值。

  • ——如果是一个叶子节点。

割点包含切割点“连续”削减,CutCategories包含的集合类。

CutPredictor

一个n元胞数组的变量的名称用于分支在每个节点,在那里n节点的数量。这些变量有时被称为减少变量。叶节点,CutPredictor包含一个空的特征向量。

割点包含切割点“连续”削减,CutCategories包含的集合类。

CutPredictorIndex

一个n使用有效的数字索引数组变量中每个节点的分支,在那里n节点的数量。有关更多信息,请参见CutPredictor

ExpandedPredictorNames

扩展预测名称,存储单元阵列的特征向量。

如果分类变量的模型使用的编码,那么ExpandedPredictorNames包括名称,描述变量扩展。否则,ExpandedPredictorNames是一样的PredictorNames

HyperparameterOptimizationResults

描述hyperparameters交叉验证优化的存储为一个BayesianOptimization对象或一个表hyperparameters和相关联的值。非空的时OptimizeHyperparameters名称-值对非空的创造。价值取决于的设置HyperparameterOptimizationOptions名称-值对在创建:

  • “bayesopt”(默认)——对象的类BayesianOptimization

  • “gridsearch”“randomsearch”——hyperparameters表使用,观察目标函数值(交叉验证损失)和从最低(最好的)最高等级的观察(坏的)

IsBranchNode

一个n元逻辑向量ib这是真正的为每个节点和分支为每一个叶子节点

ModelParameters

对象持有的参数

NumObservations

在训练数据的观察,一个数字标量。NumObservations可以小于输入数据的行数X当有缺失值X或响应Y

NodeError

一个n元向量e错误的节点,在那里n节点的数量。e(我)是节点的均方误差

NodeMean

一个n元数值数组中每个节点的平均值,在那里n是在树上的节点数量。每一个元素NodeMean的平均值是真的吗Y对所有观察值的节点。

NodeProbability

一个n元向量p节点的概率,在那里n节点的数量。一个节点的概率计算的比例从原始观测数据,满足条件的节点。

NodeRisk

一个n元向量的风险树中的节点,在哪里n节点的数量。每个节点的风险是由节点的节点误差加权的概率。

NodeSize

一个n元向量大小的节点的大小,在那里n节点的数量。大小的一个节点被定义为观测的数量从数据用来创建树节点满足条件。

NumNodes

节点的数量n

一个n元向量p包含每个节点的父节点的数量,在那里n节点的数量。根节点的父节点0

PredictorNames

一个单元阵列为预测变量的名称,在它们出现的顺序X

PruneAlpha

每修剪水平数值向量和一个元素。如果修剪水平范围从0到,然后PruneAlpha+ 1元素按升序排序。PruneAlpha (1)是修剪级别0(没有修剪),PruneAlpha (2)修剪水平1,等等。

PruneList

一个n元数值向量的每个节点修剪水平,在那里n节点的数量。修剪水平范围从0(没有修剪),在那里是最深的叶和根节点之间的距离。

ResponseName

一个特征向量指定响应变量的名称(Y)。

ResponseTransform

函数处理转换原始响应值(均方误差)。函数处理必须接受一个矩阵的响应值并返回一个相同大小的矩阵。默认的“没有”意味着@ x (x),或者没有转换。

添加或更改ResponseTransform函数使用点符号:

树。ResponseTransform = @函数

RowsUsed

一个n元逻辑向量表示哪些行最初的预测数据(X)被用于拟合。如果软件使用的所有行X,然后RowsUsed是一个空数组([])。

SurrogateCutCategories

一个n元胞数组的类别用于替代分裂,在那里n节点的数量在吗。为每个节点k,SurrogateCutCategories {k}是一个单元阵列。的长度SurrogateCutCategories {k}等于代理预测在这个节点的数量。每个元素的SurrogateCutCategories {k}要么是一个空的特征向量连续代理预测,或者是一个双元素单元阵列与类别分类代理预测。双元素单元阵列列表的第一个元素类别分配给这个代理分裂,左子和双元素单元阵列的第二个元素列表类别分配到正确的孩子通过这个代理。代孕的顺序分离变量在每个节点匹配变量的顺序SurrogateCutPredictor。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,SurrogateCutCategories包含一个空单元。

SurrogateCutFlip

一个n元胞数组的数值减少作业用来替代分裂,在那里n节点的数量在吗。为每个节点k,SurrogateCutFlip {k}是一个数值向量。的长度SurrogateCutFlip {k}等于代理预测在这个节点的数量。每个元素的SurrogateCutFlip {k}零分类代理预测,或一个数字削减分配连续代理预测。数字减少作业可以是- 1或+ 1。对于每一个代理和一个数字C基于连续的预测变量Z选择,左边的孩子Z<C和削减分配代理分+ 1,或者ZC和这个代理的切割作业是1。同样,选择正确的孩子ZC和削减分配代理分+ 1,或者Z<C和这个代理的切割作业是1。代孕的顺序分离变量在每个节点匹配变量的顺序SurrogateCutPredictor。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,SurrogateCutFlip包含一个空数组。

SurrogateCutPoint

一个n元胞数组的数值用于替代分裂,在那里n节点的数量在吗。为每个节点k,SurrogateCutPoint {k}是一个数值向量。的长度SurrogateCutPoint {k}等于代理预测在这个节点的数量。每个元素的SurrogateCutPoint {k}要么是分类代理预测,或连续的数字减少代理预测。对于每一个代理和一个数字C基于连续的预测变量Z选择,左边的孩子Z<CSurrogateCutFlip这个代理分+ 1,或者ZCSurrogateCutFlip这个代理分裂是1。同样,选择正确的孩子ZCSurrogateCutFlip这个代理分+ 1,或者Z<CSurrogateCutFlip这个代理分裂是1。代孕的顺序分离变量在每个节点相匹配的顺序返回的变量SurrCutPredictor。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,SurrogateCutPoint包含一个空单元。

SurrogateCutType

一个n元胞数组表示类型的代理将在每个节点,在那里n节点的数量在吗。为每个节点k,SurrogateCutType {k}是单元阵列类型的代理变量分裂在这个节点。预测的变量排序测量和最优预测降序排列,并仅包含了变量与积极的预测指标。代孕的顺序分离变量在每个节点匹配变量的顺序SurrogateCutPredictor。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,SurrogateCutType包含一个空单元。代孕可以分裂类型“连续”如果削减中定义的形式Z<V为一个变量Z和减少点V“分类”如果削减由是否定义Z以一组类别的一个值。

SurrogateCutPredictor

一个n元胞数组的变量的名称用于代理在每个节点分裂,在那里n节点的数量在吗。每个元素的SurrogateCutPredictor是一个单元阵列的名字在这个节点代理变量分裂。预测的变量排序测量和最优预测降序排列,并仅包含了变量与积极的预测指标。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,SurrogateCutPredictor包含一个空单元。

SurrogatePredictorAssociation

一个n元胞数组的代理将协会的预测措施,在那里n节点的数量在吗。为每个节点k,SurrogatePredictorAssociation {k}是一个数值向量。的长度SurrogatePredictorAssociation {k}等于代理预测在这个节点的数量。每个元素的SurrogatePredictorAssociation {k}给出了预测的最优分割这代理分裂之间的联系。代孕的顺序分离变量在每个节点变量的顺序SurrogateCutPredictor。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,SurrogatePredictorAssociation包含一个空单元。

W

的比例权重,一个向量的长度n的行数X

X

一个矩阵或表的预测价值。每一列的X代表一个变量,每一行代表一个观察。

Y

一个数字列向量具有相同的行数X。中的每个条目Y应对数据在相应的行吗X

对象的功能

紧凑的 紧凑的回归树
crossval 旨在决策树
cvloss 通过交叉验证回归误差
收集 收集的属性统计和机器学习工具对象从GPU
石灰 本地可model-agnostic解释(石灰)
损失 回归误差
partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望(ICE)情节
预测 预测使用回归树的反应
predictorImportance 为回归估计预测重要的树
修剪 产生的序列回归子树修剪
resubLoss resubstitution回归错误的
resubPredict 预测resubstitution回应的树
沙普利 沙普利值
surrogateAssociation 意味着预测衡量代理协会将回归树
视图 视图回归树

复制语义

价值。学习如何价值类影响复制操作,明白了复制对象

例子

全部折叠

加载示例数据。

负载carsmall

使用样本数据构造一个回归树。响应变量是英里每加仑,英里/加仑。

树= fitrtree (MPG(重量、缸),“CategoricalPredictors”2,“MinParentSize”,20岁,“PredictorNames”,{' W ',“C”})
树= RegressionTree PredictorNames: {' W ' ' C '} ResponseName:“Y”CategoricalPredictors: 2 ResponseTransform:“没有一个”NumObservations: 94属性,方法

预测4000磅的里程汽车4、6和8缸。

MPG4Kpred =预测(树,(4000 4;4000 6;4000 8])
MPG4Kpred =3×119.2778 19.2778 14.3889

引用

[1]Breiman, L。,J. Friedman, R. Olshen, and C. Stone.分类和回归树。波卡拉顿,FL: CRC出版社,1984年。

扩展功能

介绍了R2011a