主要内容

紧分类树

包裹:classreg.learning.classif

紧凑分类树

描述

精简版的分类树(类的)ClassificationTree).精简版不包括用于训练分类树的数据。因此,您不能使用紧凑的分类树执行某些任务,例如交叉验证。使用紧凑的分类树对新数据进行预测(分类)。

建设

ctree=紧凑()从完整的决策树构造紧凑的决策树。

输入参数

使用菲茨特里

属性

CategoricalPredictors

分类预测指数,指定为正整数向量。CategoricalPredictors包含指示对应的预测器是分类的索引值。索引值在1到之间P,在那里P为用于训练模型的预测器数量。如果没有任何预测器是绝对的,则此属性为空([]).

CategoricalSplit

N-by-2单元阵列,其中N是中的分类拆分数.每行CategoricalSplit为分类拆分提供左值和右值。对于具有分类拆分的每个分支节点J基于分类预测变量Z,则选择左边的子项,如果Z分类拆分(j,1)如果你愿意,你会选择合适的孩子Z分类分割(j,2).拆分的顺序与树中的节点相同。这些分割的节点可以通过运行找到cuttype选择“分类”从上到下的切割。

儿童

N-by-2数组,包含中每个节点的子节点数,在那里N为节点数。叶节点有子节点0

班级人数

N——- - - - - -K中节点的类计数数组,在那里N是节点数和K是类的数量。对于任何节点编号,这门课很重要类计数(i,:)每个类的观察计数(来自拟合树所用的数据)是否满足节点的条件

类名

中的元素列表Y删除重复项。类名可以是数字向量、分类变量向量、逻辑向量、字符数组或字符向量的单元格数组。类名是否与参数中的数据具有相同的数据类型Y(软件将字符串数组视为字符向量的单元数组。)

如果属性的值至少有一个长度维度K然后类名指示元素沿该维度的顺序(例如,成本先前的).

类概率

N——- - - - - -K中的节点的类概率数组,在那里N是节点数和K是类的数量。对于任何节点编号,类概率类概率(i,:)对于满足节点条件的点,每类的估计概率是多少

成本

方阵,成本(i,j)将一个点分类的成本是多少J如果它真正的阶级是(行对应于真实类,列对应于预测类)。的行和列的顺序成本对应于中类的顺序类名.中的行数和列数成本是响应中唯一类的数量。此属性是只读的。

切割类别

N-中分支使用的类别的by-2单元格数组,在那里N是节点数。对于每个分支节点基于分类预测变量x,则选择左边的子项,如果x是中列出的类别之一剖分类别{i,1},如果。则选择正确的子节点x是其中列出的剖分类别{i,2}.这两列的切割类别对于基于连续预测器的分支节点和叶节点,为空。

割点包含的切点“连续的”削减,切割类别包含类别集。

割点

N-中用作切点的值的元素向量,在那里N是节点数。对于每个分支节点基于连续的预测变量x,则选择左边的子项,如果x<切点(i)如果你愿意,你会选择合适的孩子x> =切割点(i)割点基于分类预测器的分支节点和叶节点。

割点包含的切点“连续的”削减,切割类别包含类别集。

剪型

N-元素单元数组,指示中每个节点的切割类型,在那里N为节点数。为每个节点,剪切类型{i}是:

  • “连续的”-如果在表格中定义了切割x < v为一个变量x和切点v

  • “分类”—如果cut是由变量定义的x获取一组类别中的值。

  • ''-如果是一个叶节点。

割点包含的切点“连续的”削减,切割类别包含类别集。

割线预测器

N-元素中每个节点中用于分支的变量名称的单元格数组,在那里N是节点数。这些变量有时称为割变量.对于叶节点,割线预测器包含空字符向量。

割点包含的切点“连续的”削减,切割类别包含类别集。

CutPredictorIndex

N-中每个节点中用于分支的变量的数值索引的元素数组,在那里N是节点数。有关详细信息,请参阅割线预测器

ExpandedPredictorNames

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型对分类变量使用编码,那么ExpandedPredictorNames包括描述扩展变量的名称。否则,ExpandedPredictorNamesPredictorNames

IsBranchNode

N元素逻辑向量符合事实的对于每个分支节点和错误的对于

节点类

N的每个节点中最有可能的类的名称,在那里N是树中的节点数。此数组的每个元素都是一个字符向量,等于类名

NodeError

N-图中节点误差的元素向量,在那里N为节点数。NodeError(i)节点的误分类概率是多少

NodeProbability

N中节点的概率的元素向量,在那里N是节点数。节点的概率计算为原始数据中满足节点条件的观测值的比例。该比例根据分配给每个类别的任何先验概率进行调整。

NodeRisk

N-树中节点风险的元素向量,其中N是节点数。每个节点的风险是该节点的杂质(基尼指数或偏差)的度量,通过节点概率进行加权。如果树按两倍增长,则每个节点的风险为零。

NodeSize

N-中节点大小的元素向量,在那里N是节点数。节点的大小定义为从用于创建满足节点条件的树的数据中观察到的数量。

珠心

节点的数量

N-元素向量,其中包含每个节点的父节点数,在那里N为节点数。根节点的父节点是0

PredictorNames

预测器变量名称的单元格数组,按它们出现的顺序排列X

先前的

每一类的先验概率的数值向量。元素的顺序先前的对应于中类的顺序类名.元素的数量先前的是响应中唯一类的数量。此属性是只读的。

梅内尔帕

每个修剪级别有一个元素的数字向量。如果修剪级别范围为0到M然后梅内尔帕M+1按升序排序的元素。李属植物(1)是修剪级别0(不修剪),李海棠(2)用于修剪级别1,依此类推。

修剪师

N的每个节点中具有修剪级别的元素数值向量,在那里N是节点数。修剪级别从0(无修剪)到M,在那里M是最深叶与根节点之间的距离。

反应胺

描述响应变量的字符向量Y

ScoreTransform

用于转换分数的函数句柄,或表示内置转换函数的字符向量。“没有”意味着没有转变;相当地,“没有”意味着@(x) x.有关内置转换函数的列表和自定义转换函数的语法,请参见菲茨特里

添加或更改ScoreTransform函数使用点表示法:

ctree。ScoreTransform = '作用”或ctree。ScoreTransform = @作用

代理类别

N-element用于分割的代理项的单元格数组,在那里N节点数在吗. 对于每个节点K,SurrogateCutCategories {k}是单元格数组。的长度SurrogateCutCategories {k}等于在该节点上找到的代理预测器的数量。每个元素的SurrogateCutCategories {k}为连续代理预测器的空字符向量,或为类别代理预测器的两元素单元格数组。这个双元素单元格数组的第一个元素列出了由这个代理拆分分配给左子元素的类别,这个双元素单元格数组的第二个元素列出了由这个代理拆分分配给右子元素的类别。在每个节点上分割变量的代理项的顺序与中的变量的顺序相匹配代用CutVar. 此节点上的最佳分割变量不会出现。对于非分支(叶)节点,代理类别包含一个空单元格。

代理剪贴画

N-中用于代理项拆分的数字切割指定的元素单元格数组,在那里N节点数在吗. 对于每个节点K,SurrSurrogateCutFlip{k}是一个数字向量。的长度代理CutFlip{k}等于在该节点上找到的代理预测器的数量。每个元素的代理CutFlip{k}对于分类代理预测器为零,对于连续代理预测器为数字切割赋值。数字切割赋值可以是-1或+1。对于每个用数字切割分割的代理项C基于连续的预测变量Z,则选择左边的子项,如果Z<C此代理项拆分的切割指定为+1,或者ZC这个代理分割的分割赋值是-1。类似地,如果ZC此代理项拆分的切割指定为+1,或者Z<C这个代理分割的分割赋值是-1。在每个节点上分割变量的代理项的顺序与中的变量的顺序相匹配替代预测因子. 此节点上的最佳分割变量不会出现。对于非分支(叶)节点,代理剪贴画包含空数组。

SurrogateCutPoint

N-中用于代理项拆分的数值的元素单元格数组,在那里N节点数在吗. 对于每个节点K,代理断点{k}是一个数字向量。的长度代理断点{k}等于在该节点上找到的代理预测器的数量。每个元素的代理断点{k}要么对于分类替代项预测器,或对于连续替代项预测器,为数字切割。对于每个带有数字切割的代理项拆分C基于连续的预测变量Z,则选择左边的子项,如果Z<C代理剪贴画对于这个代理,分割为+1,如果ZC代理剪贴画对于此代理项拆分为–1。同样,如果ZC代理剪贴画对于这个代理,分割为+1,如果Z<C代理剪贴画对于此代理项,拆分为–1。每个节点上代理项拆分变量的顺序与替代预测因子. 此节点上的最佳分割变量不会出现。对于非分支(叶)节点,SurrogateCutPoint包含一个空单元格。

SurrogateCutType

N-元素单元格数组,指示中每个节点上代理项拆分的类型,在那里N节点数在吗. 对于每个节点K,代理剪切类型{k}是一个单元格数组,其中包含此节点上的代理项拆分变量的类型。变量按照与最优预测器关联的预测量降序排序,只包含具有正向预测量的变量。在每个节点上分割变量的代理项的顺序与中的变量的顺序相匹配替代预测因子. 此节点上的最佳分割变量不会出现。对于非分支(叶)节点,SurrogateCutType包含空单元格。代理项拆分类型可以是“连续的”如果在表格中定义了切割Z<v为一个变量Z和切点v“分类”如果削减是由是否Z获取一组类别中的值。

替代预测因子

N中每个节点中用于代理分割的变量名的单元格数组,在那里N节点数在吗.每个元素的替代预测因子是一个单元格数组,其中包含此节点上代理项拆分变量的名称。变量按与最优预测因子关联的预测测度按降序排序,仅包含具有正预测测度的变量。此节点上的最佳分割变量不会出现。对于非分支(叶)节点,替代预测因子包含一个空单元格。

代理预测者协会

N-element单元阵列的预测关联度量为代理分裂,在那里N节点数在吗. 对于每个节点K,SurrogatePredictorAssociation {k}是一个数字向量。的长度SurrogatePredictorAssociation {k}等于在该节点上找到的代理预测器的数量。每个元素的SurrogatePredictorAssociation {k}给出了最佳分割和代理分割之间关联的预测度量。在每个节点上的代理分割变量的顺序是变量的顺序替代预测因子. 此节点上的最佳分割变量不会出现。对于非分支(叶)节点,代理预测者协会包含一个空单元格。

目标函数

比较控股 使用新数据比较两个分类模型的准确性
分类边
聚集 收集的属性统计和机器学习工具箱对象从GPU
石灰 局部可解释模型不可知解释(LIME)
损失 分类错误
边缘 分类的利润率
部分依赖 计算部分相关性
plotPartialDependence 创建部分依赖图(PDP)和单个条件期望图(ICE)
预测 利用分类树预测标签
预测重要性 分类树中预测因子重要性的估计
夏普利 夏普利值
代孕协会 分类树中代理项分裂关联的均值预测测度
更新 更新模型参数以生成代码
视图 视图分类树

复制语义

价值要了解值类如何影响复制操作,请参见复制对象

例子

全部崩溃

为Fisher-iris数据构造一个紧凑的分类树。

负载鱼腥草树木=fitctree(MEA,物种);ctree=compact(树木);

将结果树的大小与原始树的大小进行比较。

t=谁(“树”);% t.bytes =树的大小,以字节为单位c =谁(“ctree”);%c.bytes=以字节为单位的ctree大小[c。字节t.bytes]
ans=1×25097 11762

紧凑型树比原始树要小。

更多关于

全部展开

扩展功能

在R2011a中引入