CompactClassificationTree

包裹：classreg.learning.classif

紧凑型分类树

全部展开页面

描述

精简版的分类树(类的)ClassificationTree）.Compact版本不包括培训分类树的数据。因此，您无法使用紧凑型分类树执行一些任务，例如交叉验证。使用紧凑型分类树来进行新数据的预测（分类）。

建设

Ctree.=紧凑(树）从完整的决策树构造一个紧凑的决策树。

输入参数

`树`	使用`fitctree`．

特性

`CategoricalPredictors`	分类预测指标，指定为一个正整数向量。`CategoricalPredictors`包含与包含分类预测器的预测器数据列对应的索引值。如果没有任何预测器是绝对的，则此属性为空(`［］`）.
`CategoricalSplits`	一个N- 2个单元格阵列，其中N分类分割的数量在吗`树`．在每一行`CategoricalSplits`为分类分割提供左值和右值。对每个分支节点进行分类分割`j`基于分类预测变量`Z.`，则选择左子结点`Z.`是在`CategoricalSplits (j, 1)`选择正确的子结点，如果`Z.`是在`类别plits（J，2）`．拆分的顺序与树中的节点相同。通过选择找到这些分割的节点`'分类'`从上到下切割`CutType`财产。
`孩子们`	一个N-by-2数组，其中包含每个节点的子节点编号`树`，在哪里N为节点数。叶节点有子节点`0.`．
`ClassCount`	一个N——- - - - - -K.节点的类数组计数`树`，在哪里N是节点数量和K.为类数。对于任意节点数`一世`，班级计数`classcount（我，:)`来自满足节点条件的每个类，是从每个类的观测值（来自用于拟合树的数据）`一世`．
`Classnames.`	中的元素列表`y`删除重复的。`Classnames.`可以是数字向量、类别变量的向量、逻辑向量、字符数组或字符向量的单元格数组。`Classnames.`是否与参数中的数据具有相同的数据类型`y`．（该软件将字符串数组视为字符向量的单元格阵列。）如果属性的值至少有一个长度维度K.，然后`Classnames.`表示该维度的元素的顺序（例如，`成本`和`之前`）.
`ClassProbability`	一个N——- - - - - -K.节点的类概率数组`树`，在哪里N是节点数量和K.为类数。对于任意节点数`一世`，类概率`ClassProbability(我,:)`每个类对一个点的估计概率是否满足节点的条件`一世`．
`成本`	方矩阵，在哪里`成本（i，j）`是将一个点分类为课程的成本`j`如果它的真实课程是`一世`（行对应于真实类，列对应于预测类）。行和列的顺序`成本`对应于类的顺序`Classnames.`．行数和列的数量`成本`是响应中唯一类的数量。此属性是只读的。
`CutCategories`	一个N中分支使用的类别的单元格数组`树`，在哪里N为节点数。对于每个分支节点`一世`基于分类预测变量`X`，则选择左子结点`X`在哪些类别中`CutCategories{1},我`，如果。则选择正确的子节点`X`是其中列出的`Cutcategories {I，2}`．这两列的`CutCategories`对于基于连续预测器的分支节点和叶节点为空。 `切口`包含的切点`'连续的'`削减,`CutCategories`包含一组类别。
`切口`	一个N元素向量的值用作切入点`树`，在哪里N为节点数。对于每个分支节点`一世`基于连续的预测变量`X`，则选择左子结点`x <割点(我)`选择正确的子结点，如果`x> =切口（i）`．`切口`是`南`基于分类预测器的分支节点和叶节点。 `切口`包含的切点`'连续的'`削减,`CutCategories`包含一组类别。
`CutType`	一个N-Element Cell阵列，指示每个节点处的切口类型`树`，在哪里N为节点数。对于每个节点`一世`那`cuttype {i}`是： `'连续的'`- 如果剪切在表单中定义`X 为一个变量X和切割点V.．` `'分类'- 如果切割是由变量定义的X在一组类别中取得一个值。 ''——如果一世是叶节点。` `切口包含的切点'连续的'削减,CutCategories包含一组类别。`
`Cutpredictor.`	一个N- 用于在每个节点中用于分支的变量的名称的单元格数组`树`，在哪里N为节点数。这些变量有时被称为减少变量．叶节点,`Cutpredictor.`包含一个空字符向量。 `切口`包含的切点`'连续的'`削减,`CutCategories`包含一组类别。
`cutpredictorindex.`	一个N中的每个节点中用于分支的变量的数字索引数组`树`，在哪里N为节点数。有关更多信息，请参见`Cutpredictor.`．
`ExpandedPredictorNames`	扩展的预测器名称，存储为字符向量的单元格数组。如果模型使用对分类变量的编码，那么`ExpandedPredictorNames`包括描述扩展变量的名称。否则，`ExpandedPredictorNames`是相同的`PredictorNames`．
`Isbranchnode.`	一个N元素逻辑向量`真正的`对于每个分支节点和`错误的`的每个叶节点`树`．
`NodeClass`	一个N-element cell array，每个节点中最可能类的名称`树`，在哪里N为树中的节点数。这个数组的每个元素都是一个字符向量，等于中的一个类名`Classnames.`．
`nodeerror.`	一个N中节点误差的元素向量`树`，在哪里N为节点数。`NodeError(我)`是节点的错误分类概率`一世`．
`nodeProbability.`	一个N- 节点概率的单个矢量`树`，在哪里N为节点数。节点的概率被计算为来自满足节点条件的原始数据的观测的比例。针对分配给每个类的任何先前概率调整此比例。
`Noderisk.`	一个N-element vector的树是树中的节点的风险，其中N为节点数。每个节点的风险是由节点概率加权的该节点的杂质（GINI指数或偏差）的量度。如果树的增长，则每个节点的风险为零。
`NodeSize`	一个N中的节点大小的元素向量`树`，在哪里N为节点数。节点的大小定义为用于创建满足节点条件的树的数据的观察数。
`numnodes.`	节点的数量`树`．
`父母`	一个N-Element矢量包含每个节点的父节点的数量`树`，在哪里N为节点数。根节点的父节点是`0.`．
`PredictorNames`	预测器变量的一个小区数组，按照它们出现的顺序`X`．
`之前`	每个班级的先前概率的数字矢量。元素的顺序`之前`对应于类的顺序`Classnames.`．元素的数量`之前`是响应中唯一类的数量。此属性是只读的。
`PruneAlpha`	数值矢量与每个修剪水平的一个元素。如果修剪级别范围为0到m，然后`PruneAlpha`拥有m+ 1个元素按升序排序。`Prunealpha（1）`是修剪级别0(不修剪)，`Prunealpha（2）`用于修剪级别1，以此类推。
`梅尔格莱斯`	一个N-element数字矢量与每个节点的修剪级别`树`，在哪里N为节点数。修剪水平范围为0（无修剪）m，在哪里m为最深处的叶子与根节点之间的距离。
`ractraceame.`	描述响应变量的字符向量`y`．
`ScoreTransform`	用于转换分数的函数句柄，或表示内置转换函数的字符向量。`'没有任何'`意味着没有转换;同样,`'没有任何'`方法`@ x (x)`．有关内置转换功能列表和自定义转换功能的语法，请参阅`fitctree`．添加或更改`ScoreTransform`函数使用点表示法: ctree.scoretransform ='函数”或ctree。ScoreTransform = @函数
`surrogatecutcategories.`	一个N- 用于代理分裂的类别的单元格阵列`树`，在哪里N是节点的数量`树`．对于每个节点`K.`那`SurrogateCutCategories {k}`是一个小区阵列。长度`SurrogateCutCategories {k}`等于此节点上发现的代理预测器的数量。每个元素`SurrogateCutCategories {k}`是连续代理预测器的空字符向量，或者是一个双元素单元数组，其中包含分类代理预测器的类别。这种双元素单元阵列的第一个元素列出了由此代理拆分分配给左子子的类别以及该代理拆分分配给右侧子项的类别的第二个元素。每个节点处的代理分割变量的顺序与变量顺序匹配`SurrogateCutVar`．这个节点上的最优分割变量不会出现。对于非支链（叶）节点，`surrogatecutcategories.`包含一个空单元格。
`SurrogateCutFlip`	一个N用于代理拆分的数字切割赋值的单元格数组`树`，在哪里N是节点的数量`树`．对于每个节点`K.`那`surrowrogatecutflip {k}`是数字矢量。长度`SurrogateCutFlip {k}`等于此节点上发现的代理预测器的数量。每个元素`SurrogateCutFlip {k}`对于分类代理预测器为零，对于连续代理预测器为数字切割赋值。数字切割赋值可以是-1或+1。对于每个替代品分裂，用数字剪切C基于连续的预测变量Z.，则选择左子结点Z.<C这个代理分割的切割赋值是+1，或者Z.≥C这个代理分割的分割赋值是-1。同样，如果选择合适的孩子Z.≥C这个代理分割的切割赋值是+1，或者Z.<C这个代理分割的分割赋值是-1。每个节点处的代理分割变量的顺序与变量顺序匹配`surrogatecutprepictor.`．这个节点上的最优分割变量不会出现。对于非支链（叶）节点，`SurrogateCutFlip`包含一个空数组。
`SurrogateCutPoint`	一个N用于代理的数值的单元格数组`树`，在哪里N是节点的数量`树`．对于每个节点`K.`那`SurrogateCutPoint {k}`是数字矢量。长度`SurrogateCutPoint {k}`等于此节点上发现的代理预测器的数量。每个元素`SurrogateCutPoint {k}`或者是`南`对于分类代理预测器，或用于连续代理预测器的数字切割。对于每个替代品分裂，用数字剪切C基于连续的预测变量Z.，则选择左子结点Z.<C和`SurrogateCutFlip`对于这个代理，分割为+1，如果Z.≥C和`SurrogateCutFlip`对于这个代理拆分为-1。同样，如果选择合适的孩子Z.≥C和`SurrogateCutFlip`对于这个代理，分割为+1，如果Z.<C和`SurrogateCutFlip`对于这个代理拆分为-1。在每个节点上分割的代理变量的顺序与返回的变量的顺序匹配`surrogatecutprepictor.`．这个节点上的最优分割变量不会出现。对于非支链（叶）节点，`SurrogateCutPoint`包含一个空单元格。
`surrogatecuttype.`	一个N-element小区阵列，指示每个节点处的代理分裂类型`树`，在哪里N是节点的数量`树`．对于每个节点`K.`那`surrogatecuttype {k}`是一个单元数组，具有此节点的代理分割变量的类型。变量按照与最优预测器关联的预测量降序排序，只包含具有正向预测量的变量。每个节点处的代理分割变量的顺序与变量顺序匹配`surrogatecutprepictor.`．这个节点上的最优分割变量不会出现。对于非支链（叶）节点，`surrogatecuttype.`包含一个空单元格。代理分割类型可以是以下两种`'连续的'`如果切割在形式中被定义`Z.`<`V.`为一个变量`Z.`和切割点`V.`或`'分类'`如果切割是由是否定义的`Z.`在一组类别中取得一个值。
`surrogatecutprepictor.`	一个N中每个节点中用于代理分割的变量名的单元格数组`树`，在哪里N是节点的数量`树`．每个元素`surrogatecutprepictor.`是一个单元格数组，其中包含此节点上的代理项拆分变量的名称。变量按照与最优预测器关联的预测量降序排序，只包含具有正向预测量的变量。这个节点上的最优分割变量不会出现。对于非支链（叶）节点，`surrogatecutprepictor.`包含一个空单元格。
`SurrogatePredictorAssociation`	一个N-Element Cell阵列的代理分裂关联的预测措施`树`，在哪里N是节点的数量`树`．对于每个节点`K.`那`替代商品报gRedicorAssociation{k}`是数字矢量。长度`替代商品报gRedicorAssociation{k}`等于此节点上发现的代理预测器的数量。每个元素`替代商品报gRedicorAssociation{k}`给出了最佳分裂与此代理分裂之间的关联的预测措施。每个节点处的替代分类变量的顺序是变量的顺序`surrogatecutprepictor.`．这个节点上的最优分割变量不会出现。对于非支链（叶）节点，`SurrogatePredictorAssociation`包含一个空单元格。

对象功能

`边缘`	分类的优势
`损失`	分类错误
`保证金`	分类的利润率
`部分竞争`	计算部分依赖
`绘图竞争依赖性`	创建部分依赖图（PDP）和个人有条件期望（ICE）情节
`预测`	使用分类树预测标签
`预测的重要性`	分类树中预测因子重要性的估计
`Trustogateassociation.`	分类树中替代分裂关联关联的平均预测措施
`更新`	更新代码生成的模型参数
`看法`	视图分类树

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象．

例子

全部收缩

构建一个紧凑的分类树

打开生活的脚本

为Fisher虹膜数据构造一个紧凑的分类树。

加载fisheriris树= fitctree（meas，mepies）;ctree = compact（树）;

将生成的树的大小与原始树的大小进行比较。

t =谁(“树”）;% t.bytes =树的大小，以字节为单位c = whos（“ctree”）;% c.bytes = ctree的大小[C.Bytes T.Bytes]

ans =.1×25097 11762

紧凑型树比原始树要小。

扩展能力

C / C ++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用说明和限制：

这预测和更新函数支持代码生成。金宝app
当你用fitctree，适用以下限制。
- 类标记输入参数值(y）不能是一个分类的数组。
- 代码生成不支持分类预测器(金宝app逻辑那分类那字符那细绳,或细胞）.如果在表中提供培训数据，则预测器必须是数字（双倍的或单身的）.同样，你不能使用'pationoricalpricictors'名称值对参数。要在模型中包含分类预测器，请通过使用预处理分类预计戴维尔在拟合模型之前。
- 价值“类名”名称 - 值对参数不能是一个分类数组。
- 价值“ScoreTransform”名称-值对参数不能是匿名函数。对于定点代码生成，“ScoreTransform”值不能'invlogit'．
- 你不能使用代理分裂，即“代孕”名称-值对参数必须为“关闭”．