CompactRegressionTree

包:classreg.learning.regr

紧回归树

全部展开页面

描述

回归树的紧凑版本(类的)回归树)．精简版不包括用于训练回归树的数据。因此，您不能使用紧凑的回归树执行某些任务，例如交叉验证。使用紧凑的回归树对新数据进行预测(回归)。

建设

携程=紧凑型(树）从完整的决策树构造紧凑的决策树。

输入参数

全部展开

`树`- - - - - -完整的、训练有素的回归树
`回归树`对象

完整的，经过训练的回归树，指定为回归树由构造的对象菲特里．

属性

`分类预测因子`	分类预测指标，指定为一个正整数向量。`分类预测因子`包含与包含分类预测器的预测器数据列对应的索引值。如果没有任何预测器是绝对的，则此属性为空(`[]`)．
`CategoricalSplits`	一个n-by-2 cell arrayn分类分割的数量在吗`树`．在每一行`CategoricalSplits`为分类分割提供左值和右值。对每个分支节点进行分类分割`j`基于一个绝对预测变量`z`，则选择左子结点`z`是在`CategoricalSplits (j, 1)`选择正确的子结点，如果`z`是在`CategoricalSplits (j, 2)`. 拆分的顺序与树的节点相同。这些拆分的节点可以通过运行`剪型`并选择`“绝对的”`从上到下切割。
`孩子们`	一个n-by-2数组，其中包含每个节点的子节点编号`树`哪里n是节点数。叶节点有子节点`0`．
`CutCategories`	一个n中分支使用的类别的单元格数组`树`哪里n为节点数。对于每个分支节点`我`基于一个绝对预测变量`x`，则选择左子结点`x`在哪些类别中`CutCategories{1},我`，并且如果`x`是中列出的`CutCategories{2},我`.两栏`CutCategories`对于基于连续预测器的分支节点和叶节点为空。 `切点`包含以下对象的切点：`“连续”`削减，以及`CutCategories`包含类别的集合。
`切点`	一个n元素向量的值用作切入点`树`哪里n为节点数。对于每个分支节点`我`基于连续预测变量`x`，则选择左子结点`割点< v(我)`选择正确的子结点，如果`x > =割点(我)`．`切点`是`南`对于基于分类预测器的分支节点和叶节点。
`CutType`	一个n中每个节点的切割类型`树`哪里n是节点数。对于每个节点`我`，`CutType{我}`是: `“连续”`-如果切割是在形式中定义的`x对于一个变量x和减少点v．` `“绝对的”-如果切割是由变量x接受一组类别中的值。 '＇——如果我是一个叶节点。` `切点包含以下对象的切点：“连续”削减，以及CutCategories包含类别的集合。`
`CutPredictor`	一个n中的每个节点中用于分支的变量名称的单元格数组`树`哪里n为节点数。这些变量有时被称为减少变量．叶节点,`CutPredictor`包含一个空字符向量。 `切点`包含以下对象的切点：`“连续”`削减，以及`CutCategories`包含类别的集合。
`CutPredictorIndex`	一个n中的每个节点中用于分支的变量的数字索引数组`树`哪里n为节点数。有关更多信息，请参见`CutPredictor`．
`扩展预测器名称`	扩展的预测器名称，存储为字符向量的单元格数组。如果模型对分类变量使用编码，那么`扩展预测器名称`包括描述扩展变量的名称。否则,`扩展预测器名称`是一样的`预测器名称`．
`IsBranchNode`	一个n元逻辑向量`ib`这是`真正的`对于每个分支节点和`假`的每个叶节点`树`．
`NodeError`	一个n元向量`e`节点的误差`树`哪里n为节点数。`e(我)`节点的误分类概率是多少`我`．
`诺德米安`	一个n的每个节点的平均值的元素数值数组`树`哪里n是树中的节点数。中的每个元素`诺德米安`平均值是真实的吗`Y`节点中所有观测值的值。
`NodeProbability`	一个n元向量`p`节点的概率`树`哪里n为节点数。节点的概率是根据原始数据中满足节点条件的观测值所占的比例来计算的。这个比例根据分配给每个类别的任何先验概率进行调整。
`NodeRisk`	一个n-树中节点风险的元素向量，其中n为节点数。每个节点的风险是由节点概率加权的节点误差。
`节点化`	一个n元向量`大小`的节点大小`树`哪里n为节点数。节点的大小定义为用于创建满足节点条件的树的数据的观察数。
`NumNodes`	节点数`n`在`树`．
`父`	一个n元向量`p`中每个节点的父节点的编号`树`哪里n是节点数。根节点的父节点为`0`．
`预测器名称`	预测器变量名称的单元格数组，按其在`X`．
`PruneAlpha`	数字向量，每个修剪级别有一个元素。修剪级别的取值范围为0 ~米,然后`PruneAlpha`有米+ 1个按升序排序的元素。`PruneAlpha (1)`用于修剪级别0（无修剪），`PruneAlpha (2)`用于修剪级别1，以此类推。
`PruneList`	一个n的每个节点中具有修剪级别的元素数值向量`树`哪里n为节点数。修剪级别从0(不修剪)到米哪里米为最深处的叶子与根节点之间的距离。
`ResponseName`	响应变量的名称`Y`，字符向量。
`ResponseTransform`	用于转换原始响应值(均方误差)的函数句柄。函数句柄必须接受响应值的矩阵，并返回相同大小的矩阵。默认的`“没有”`方法`@ x (x)`，或不进行转换。添加或更改`ResponseTransform`使用点表示法的函数： ctree。ResponseTransform = @函数
`SurrogateCutCategories`	一个n-中用于代理项拆分的类别的元素单元格数组`树`哪里n节点数在吗`树`．为每个节点`k`，`代理类别{k}`是单元格数组。的长度`代理类别{k}`等于在该节点上找到的代理预测器的数量。每个元素的`代理类别{k}`为连续代理预测器的空字符向量，或为类别代理预测器的两元素单元格数组。这个双元素单元格数组的第一个元素列出了由这个代理拆分分配给左子元素的类别，而这个双元素单元格数组的第二个元素则列出了由这个代理拆分分配给右子元素的类别。在每个节点上分割变量的代理项的顺序与中的变量的顺序相匹配`SurrogateCutPredictor`．这个节点上的最优分割变量不会出现。对于非分支(叶)节点，`SurrogateCutCategories`包含一个空单元格。
`SurrogateCutFlip`	一个n用于代理拆分的数字切割赋值的单元格数组`树`哪里n节点数在吗`树`．为每个节点`k`，`SurrogateCutFlip {k}`是一个数字向量。的长度`SurrogateCutFlip {k}`等于在该节点上找到的代理预测器的数量。每个元素的`SurrogateCutFlip {k}`对于分类代理项预测器为零，对于连续代理项预测器为数字切割赋值。数字切割赋值可以是–1或+1。对于每个使用数字切割的代理项拆分C基于连续预测变量Z，则选择左子结点Z<C这个代理分割的切割赋值是+1，或者Z≥C此代理项拆分的切割赋值为–1。同样，如果Z≥C这个代理分割的切割赋值是+1，或者Z<C此代理项拆分的切割赋值为–1。每个节点上代理项拆分变量的顺序与中变量的顺序匹配`SurrogateCutPredictor`．这个节点上的最优分割变量不会出现。对于非分支(叶)节点，`SurrogateCutFlip`包含空数组。
`SurrogateCutPoint`	一个n用于代理的数值的单元格数组`树`哪里n节点数在吗`树`．为每个节点`k`，`SurrogateCutPoint {k}`是一个数字向量。的长度`SurrogateCutPoint {k}`等于在该节点上找到的代理预测器的数量。每个元素的`SurrogateCutPoint {k}`要么是`南`对于分类代理预测器，或者对于连续代理预测器，进行数字切割。对于每个用数字切割分割的代理项C基于连续预测变量Z，则选择左子结点Z<C和`SurrogateCutFlip`对于此代理项，拆分为+1，或者如果Z≥C和`SurrogateCutFlip`对于这个代理拆分为-1。类似地，如果Z≥C和`SurrogateCutFlip`对于此代理项，拆分为+1，或者如果Z<C和`SurrogateCutFlip`对于这个代理拆分为-1。在每个节点上分割的代理变量的顺序与返回的变量的顺序匹配`SurrogateCutVar`．这个节点上的最优分割变量不会出现。对于非分支(叶)节点，`SurrogateCutPoint`包含一个空单元格。
`替代剪型`	一个n中每个节点的代理分割类型`树`哪里n节点数在吗`树`．为每个节点`k`，`SurrogateCutType {k}`是一个单元格数组，在此节点上具有代理项拆分变量的类型。变量按与最优预测因子关联的预测测度按降序排序，仅包含具有正预测测度的变量。每个节点上代理项拆分变量的顺序与中变量的顺序匹配`SurrogateCutPredictor`．这个节点上的最优分割变量不会出现。对于非分支(叶)节点，`替代剪型`包含一个空单元格。代理分割类型可以是以下两种`“连续”`如果切割在形式中被定义`Z`<`V`对于一个变量`Z`和减少点`V`或`“绝对的”`如果削减是由是否`Z`接受一组类别中的值。
`SurrogateCutPredictor`	一个n-元素中每个节点中用于代理项拆分的变量名称的单元格数组`树`哪里n节点数在吗`树`．每个元素的`SurrogateCutPredictor`是一个单元格数组，其中包含此节点上的代理项拆分变量的名称。变量按照与最优预测器关联的预测量降序排序，只包含具有正向预测量的变量。这个节点上的最优分割变量不会出现。对于非分支(叶)节点，`SurrogateCutPredictor`包含一个空单元格。
`SurrogatePredictorAssociation`	一个n-element单元阵列的预测关联度量为代理分裂`树`哪里n节点数在吗`树`．为每个节点`k`，`代理预测关联{k}`是一个数字向量。的长度`代理预测关联{k}`等于在该节点上找到的代理预测器的数量。每个元素的`代理预测关联{k}`给出了最佳分割与此代理分割之间关联的预测度量。每个节点上代理项拆分变量的顺序是中变量的顺序`SurrogateCutPredictor`．这个节点上的最优分割变量不会出现。对于非分支(叶)节点，`SurrogatePredictorAssociation`包含一个空单元格。

对象的功能

`丧失`	回归误差
`partialDependence`	计算部分依赖
`局部依赖`	创建部分依赖图(PDP)和个人条件期望图(ICE)
`预测`	使用回归树预测反应
`predictorImportance`	回归树预测因子重要性的估计
`surrogateAssociation`	回归树中替代分裂关联的均值预测测度
`更新`	更新代码生成的模型参数
`视图`	视图回归树

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象．

例子

全部折叠

构造并紧致回归树

打开生活的脚本

加载示例数据。

负载carsmall

为样本数据构建回归树。

[重量，气缸]，MPG，．..“MinParentSize”, 20岁,．..“PredictorNames”, {' W '，“C”})；

制作一个紧凑版本的树。

ctree =紧凑(树);

比较紧凑树和完整树的大小。

t =谁(“树”)；%t.bytes=树的大小（以字节为单位）c=谁(“ctree”)；% c.bytes = ctree的大小[c。字节t.bytes]

ans =1×24311 7558

紧凑的树比完整的树小。

扩展功能

C/C++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用说明和限制：

的预测和更新函数支持代码生成。金宝app
当您使用菲特里，适用以下限制。
- 代码生成不支持分类预测器(金宝app逻辑，明确的，烧焦，字符串,或细胞)．如果在表中提供培训数据，则预测器必须是数字的(双重的或单)。此外，您不能使用“CategoricalPredictors”名称-值对的论点。要在模型中包含范畴预测因子，使用dummyvar在拟合模型之前。
- 价值“ResponseTransform”名称-值对参数不能是匿名函数。对于定点代码生成，“ResponseTransform”值必须是“没有”．
- 不能使用代理项拆分，即“代孕”名称-值对参数必须为“关”．