主要内容

CompactClassificationTree

包裹:classreg.learning.classif

紧凑型分类树

描述

精简版的分类树(类的)ClassificationTree).Compact版本不包括培训分类树的数据。因此,您无法使用紧凑型分类树执行一些任务,例如交叉验证。使用紧凑型分类树来进行新数据的预测(分类)。

建设

Ctree.=紧凑(从完整的决策树构造一个紧凑的决策树。

输入参数

使用fitctree

特性

CategoricalPredictors

分类预测指标,指定为一个正整数向量。CategoricalPredictors包含与包含分类预测器的预测器数据列对应的索引值。如果没有任何预测器是绝对的,则此属性为空([]).

CategoricalSplits

一个N- 2个单元格阵列,其中N分类分割的数量在吗.在每一行CategoricalSplits为分类分割提供左值和右值。对每个分支节点进行分类分割j基于分类预测变量Z.,则选择左子结点Z.是在CategoricalSplits (j, 1)选择正确的子结点,如果Z.是在类别plits(J,2).拆分的顺序与树中的节点相同。通过选择找到这些分割的节点'分类'从上到下切割CutType财产。

孩子们

一个N-by-2数组,其中包含每个节点的子节点编号, 在哪里N为节点数。叶节点有子节点0.

ClassCount

一个N——- - - - - -K.节点的类数组计数, 在哪里N是节点数量和K.为类数。对于任意节点数一世,班级计数classcount(我,:)来自满足节点条件的每个类,是从每个类的观测值(来自用于拟合树的数据)一世

Classnames.

中的元素列表y删除重复的。Classnames.可以是数字向量、类别变量的向量、逻辑向量、字符数组或字符向量的单元格数组。Classnames.是否与参数中的数据具有相同的数据类型y(该软件将字符串数组视为字符向量的单元格阵列。)

如果属性的值至少有一个长度维度K., 然后Classnames.表示该维度的元素的顺序(例如,成本之前).

ClassProbability

一个N——- - - - - -K.节点的类概率数组, 在哪里N是节点数量和K.为类数。对于任意节点数一世,类概率ClassProbability(我,:)每个类对一个点的估计概率是否满足节点的条件一世

成本

方矩阵,在哪里成本(i,j)是将一个点分类为课程的成本j如果它的真实课程是一世(行对应于真实类,列对应于预测类)。行和列的顺序成本对应于类的顺序Classnames..行数和列的数量成本是响应中唯一类的数量。此属性是只读的。

CutCategories

一个N中分支使用的类别的单元格数组, 在哪里N为节点数。对于每个分支节点一世基于分类预测变量X,则选择左子结点X在哪些类别中CutCategories{1},我,如果。则选择正确的子节点X是其中列出的Cutcategories {I,2}.这两列的CutCategories对于基于连续预测器的分支节点和叶节点为空。

切口包含的切点'连续的'削减,CutCategories包含一组类别。

切口

一个N元素向量的值用作切入点, 在哪里N为节点数。对于每个分支节点一世基于连续的预测变量X,则选择左子结点x <割点(我)选择正确的子结点,如果x> =切口(i)切口基于分类预测器的分支节点和叶节点。

切口包含的切点'连续的'削减,CutCategories包含一组类别。

CutType

一个N-Element Cell阵列,指示每个节点处的切口类型, 在哪里N为节点数。对于每个节点一世cuttype {i}是:

  • '连续的'- 如果剪切在表单中定义X 为一个变量X和切割点V.

  • '分类'- 如果切割是由变量定义的X在一组类别中取得一个值。

  • ''——如果一世是叶节点。

切口包含的切点'连续的'削减,CutCategories包含一组类别。

Cutpredictor.

一个N- 用于在每个节点中用于分支的变量的名称的单元格数组, 在哪里N为节点数。这些变量有时被称为减少变量.叶节点,Cutpredictor.包含一个空字符向量。

切口包含的切点'连续的'削减,CutCategories包含一组类别。

cutpredictorindex.

一个N中的每个节点中用于分支的变量的数字索引数组, 在哪里N为节点数。有关更多信息,请参见Cutpredictor.

ExpandedPredictorNames

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型使用对分类变量的编码,那么ExpandedPredictorNames包括描述扩展变量的名称。否则,ExpandedPredictorNames是相同的PredictorNames

Isbranchnode.

一个N元素逻辑向量真正的对于每个分支节点和错误的的每个叶节点

NodeClass

一个N-element cell array,每个节点中最可能类的名称, 在哪里N为树中的节点数。这个数组的每个元素都是一个字符向量,等于中的一个类名Classnames.

nodeerror.

一个N中节点误差的元素向量, 在哪里N为节点数。NodeError(我)是节点的错误分类概率一世

nodeProbability.

一个N- 节点概率的单个矢量, 在哪里N为节点数。节点的概率被计算为来自满足节点条件的原始数据的观测的比例。针对分配给每个类的任何先前概率调整此比例。

Noderisk.

一个N-element vector的树是树中的节点的风险,其中N为节点数。每个节点的风险是由节点概率加权的该节点的杂质(GINI指数或偏差)的量度。如果树的增长,则每个节点的风险为零。

NodeSize

一个N中的节点大小的元素向量, 在哪里N为节点数。节点的大小定义为用于创建满足节点条件的树的数据的观察数。

numnodes.

节点的数量

父母

一个N-Element矢量包含每个节点的父节点的数量, 在哪里N为节点数。根节点的父节点是0.

PredictorNames

预测器变量的一个小区数组,按照它们出现的顺序X

之前

每个班级的先前概率的数字矢量。元素的顺序之前对应于类的顺序Classnames..元素的数量之前是响应中唯一类的数量。此属性是只读的。

PruneAlpha

数值矢量与每个修剪水平的一个元素。如果修剪级别范围为0到m, 然后PruneAlpha拥有m+ 1个元素按升序排序。Prunealpha(1)是修剪级别0(不修剪),Prunealpha(2)用于修剪级别1,以此类推。

梅尔格莱斯

一个N-element数字矢量与每个节点的修剪级别, 在哪里N为节点数。修剪水平范围为0(无修剪)m, 在哪里m为最深处的叶子与根节点之间的距离。

ractraceame.

描述响应变量的字符向量y

ScoreTransform

用于转换分数的函数句柄,或表示内置转换函数的字符向量。'没有任何'意味着没有转换;同样,'没有任何'方法@ x (x).有关内置转换功能列表和自定义转换功能的语法,请参阅fitctree

添加或更改ScoreTransform函数使用点表示法:

ctree.scoretransform ='函数”或ctree。ScoreTransform = @函数

surrogatecutcategories.

一个N- 用于代理分裂的类别的单元格阵列, 在哪里N是节点的数量.对于每个节点K.SurrogateCutCategories {k}是一个小区阵列。长度SurrogateCutCategories {k}等于此节点上发现的代理预测器的数量。每个元素SurrogateCutCategories {k}是连续代理预测器的空字符向量,或者是一个双元素单元数组,其中包含分类代理预测器的类别。这种双元素单元阵列的第一个元素列出了由此代理拆分分配给左子子的类别以及该代理拆分分配给右侧子项的类别的第二个元素。每个节点处的代理分割变量的顺序与变量顺序匹配SurrogateCutVar.这个节点上的最优分割变量不会出现。对于非支链(叶)节点,surrogatecutcategories.包含一个空单元格。

SurrogateCutFlip

一个N用于代理拆分的数字切割赋值的单元格数组, 在哪里N是节点的数量.对于每个节点K.surrowrogatecutflip {k}是数字矢量。长度SurrogateCutFlip {k}等于此节点上发现的代理预测器的数量。每个元素SurrogateCutFlip {k}对于分类代理预测器为零,对于连续代理预测器为数字切割赋值。数字切割赋值可以是-1或+1。对于每个替代品分裂,用数字剪切C基于连续的预测变量Z.,则选择左子结点Z.<C这个代理分割的切割赋值是+1,或者Z.C这个代理分割的分割赋值是-1。同样,如果选择合适的孩子Z.C这个代理分割的切割赋值是+1,或者Z.<C这个代理分割的分割赋值是-1。每个节点处的代理分割变量的顺序与变量顺序匹配surrogatecutprepictor..这个节点上的最优分割变量不会出现。对于非支链(叶)节点,SurrogateCutFlip包含一个空数组。

SurrogateCutPoint

一个N用于代理的数值的单元格数组, 在哪里N是节点的数量.对于每个节点K.SurrogateCutPoint {k}是数字矢量。长度SurrogateCutPoint {k}等于此节点上发现的代理预测器的数量。每个元素SurrogateCutPoint {k}或者是对于分类代理预测器,或用于连续代理预测器的数字切割。对于每个替代品分裂,用数字剪切C基于连续的预测变量Z.,则选择左子结点Z.<CSurrogateCutFlip对于这个代理,分割为+1,如果Z.CSurrogateCutFlip对于这个代理拆分为-1。同样,如果选择合适的孩子Z.CSurrogateCutFlip对于这个代理,分割为+1,如果Z.<CSurrogateCutFlip对于这个代理拆分为-1。在每个节点上分割的代理变量的顺序与返回的变量的顺序匹配surrogatecutprepictor..这个节点上的最优分割变量不会出现。对于非支链(叶)节点,SurrogateCutPoint包含一个空单元格。

surrogatecuttype.

一个N-element小区阵列,指示每个节点处的代理分裂类型, 在哪里N是节点的数量.对于每个节点K.surrogatecuttype {k}是一个单元数组,具有此节点的代理分割变量的类型。变量按照与最优预测器关联的预测量降序排序,只包含具有正向预测量的变量。每个节点处的代理分割变量的顺序与变量顺序匹配surrogatecutprepictor..这个节点上的最优分割变量不会出现。对于非支链(叶)节点,surrogatecuttype.包含一个空单元格。代理分割类型可以是以下两种'连续的'如果切割在形式中被定义Z.<V.为一个变量Z.和切割点V.'分类'如果切割是由是否定义的Z.在一组类别中取得一个值。

surrogatecutprepictor.

一个N中每个节点中用于代理分割的变量名的单元格数组, 在哪里N是节点的数量.每个元素surrogatecutprepictor.是一个单元格数组,其中包含此节点上的代理项拆分变量的名称。变量按照与最优预测器关联的预测量降序排序,只包含具有正向预测量的变量。这个节点上的最优分割变量不会出现。对于非支链(叶)节点,surrogatecutprepictor.包含一个空单元格。

SurrogatePredictorAssociation

一个N-Element Cell阵列的代理分裂关联的预测措施, 在哪里N是节点的数量.对于每个节点K.替代商品报gRedicorAssociation{k}是数字矢量。长度替代商品报gRedicorAssociation{k}等于此节点上发现的代理预测器的数量。每个元素替代商品报gRedicorAssociation{k}给出了最佳分裂与此代理分裂之间的关联的预测措施。每个节点处的替代分类变量的顺序是变量的顺序surrogatecutprepictor..这个节点上的最优分割变量不会出现。对于非支链(叶)节点,SurrogatePredictorAssociation包含一个空单元格。

对象功能

边缘 分类的优势
损失 分类错误
保证金 分类的利润率
部分竞争 计算部分依赖
绘图竞争依赖性 创建部分依赖图(PDP)和个人有条件期望(ICE)情节
预测 使用分类树预测标签
预测的重要性 分类树中预测因子重要性的估计
Trustogateassociation. 分类树中替代分裂关联关联的平均预测措施
更新 更新代码生成的模型参数
看法 视图分类树

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部收缩

为Fisher虹膜数据构造一个紧凑的分类树。

加载fisheriris树= fitctree(meas,mepies);ctree = compact(树);

将生成的树的大小与原始树的大小进行比较。

t =谁(“树”);% t.bytes =树的大小,以字节为单位c = whos(“ctree”);% c.bytes = ctree的大小[C.Bytes T.Bytes]
ans =.1×25097 11762

紧凑型树比原始树要小。

更多关于

展开全部

扩展能力

介绍了R2011a