CompactClassificationTree

包:classreg.learning.classif

紧凑的分类树

描述

紧凑版本的一个分类树(类ClassificationTree)。紧凑版本不包括的数据训练分类树。因此,您不能执行一些任务紧凑的分类树,如交叉验证。用一个简洁的分类树做预测(分类)的新数据。

建设

ctree=紧凑(树)结构紧凑的决策树从一个完整的决策树。

输入参数

`树`	使用决策树构造`fitctree`。

属性

`CategoricalPredictors`	分类预测指标,指定为一个向量的正整数。`CategoricalPredictors`包含索引值表明相应的预测分类。索引值介于1和`p`,在那里`p`预测的数量被用来训练模型。如果所有的预测都直言,那么这个属性是空的(`[]`)。
`CategoricalSplit`	一个n2单元阵列,`n`是绝对的数量将在吗`树`。在每一行`CategoricalSplit`给左和右值分类分裂。为每个分支节点与分类`j`基于分类预测变量`z`选择,左边的孩子`z`是在`CategoricalSplit (j, 1)`和孩子选择`z`是在`CategoricalSplit (j, 2)`。分裂在同一个订单的节点树。节点对这些分歧可以通过运行中找到`cuttype`并选择`“分类”`从上到下。
`孩子们`	一个n2数组包含每个节点的子节点的数量`树`,在那里n节点的数量。叶节点有子节点`0`。
`ClassCount`	一个n——- - - - - -k数组的类数的节点`树`,在那里n节点和数量吗k类的数量。任何节点的数量`我`,类计数`ClassCount(我,:)`是重要的观察(树)用于拟合的数据从每个类满足条件节点`我`。
`一会`	元素的列表`Y`删除重复的。`一会`可以是一个数值向量,向量的分类变量、逻辑向量,字符数组或单元阵列特征向量。`一会`具有相同的数据类型作为数据的论点吗`Y`。(软件对字符串数组作为细胞阵列特征向量)。如果一个属性的值的长度至少有一个维度k,然后`一会`指示元素的顺序沿着维度(例如,`成本`和`之前`)。
`ClassProbability`	一个n——- - - - - -k数组的类节点的概率`树`,在那里n节点和数量吗k类的数量。任何节点的数量`我`,类概率`ClassProbability(我,:)`为每个类一个点估计的概率满足的条件节点`我`。
`成本`	方阵,`成本(i, j)`是一个指向类分类的成本`j`如果它真正的类`我`(行对应于真正的阶级和列对应于预测类)。的行和列的顺序`成本`对应于类的顺序`一会`。行和列的数量`成本`在响应中是独特的类的数量。这个属性是只读的。
`CutCategories`	一个n2单元阵列在分支机构使用的类别`树`,在那里n节点的数量。为每个分支节点`我`基于分类预测变量`x`选择,左边的孩子`x`在列出的类别吗`CutCategories{1},我`选择,正确的孩子`x`中列出的那些吗`CutCategories{2},我`。这两列的`CutCategories`是空的基于连续预测分支节点和叶节点。 `割点`包含切割点`“连续”`削减,`CutCategories`包含的集合类。
`割点`	一个n元向量的值用作切割点`树`,在那里n节点的数量。为每个分支节点`我`基于连续的预测变量`x`选择,左边的孩子`x <割点(我)`和孩子选择`x > =割点(我)`。`割点`是`南`基于分类预测的分支节点和叶节点。 `割点`包含切割点`“连续”`削减,`CutCategories`包含的集合类。
`CutType`	一个n元胞数组表示将在每个节点的类型`树`,在那里n节点的数量。为每个节点`我`,`CutType{我}`是: `“连续”`——如果伤口中定义的形式`x < v`为一个变量`x`和减少点`v`。 `“分类”`——如果将被定义为一个变量`x`以一组类别的一个值。 `”`——如果`我`是一个叶子节点。 `割点`包含切割点`“连续”`削减,`CutCategories`包含的集合类。
`CutPredictor`	一个n元胞数组的变量的名称用于分支在每个节点`树`,在那里n节点的数量。这些变量有时被称为减少变量。叶节点,`CutPredictor`包含一个空的特征向量。 `割点`包含切割点`“连续”`削减,`CutCategories`包含的集合类。
`CutPredictorIndex`	一个n使用有效的数字索引数组变量中每个节点的分支`树`,在那里n节点的数量。有关更多信息,请参见`CutPredictor`。
`ExpandedPredictorNames`	扩展预测名称,存储单元阵列的特征向量。如果分类变量的模型使用的编码,那么`ExpandedPredictorNames`包括名称,描述变量扩展。否则,`ExpandedPredictorNames`是一样的`PredictorNames`。
`IsBranchNode`	一个n元逻辑向量`真正的`为每个节点和分支`假`为每一个叶子节点`树`。
`NodeClass`	一个n元胞数组的名字在每个节点的最可能的类`树`,在那里n是在树上的节点数量。这个数组的每个元素是一个特征向量的一个类名`一会`。
`NodeError`	一个n元向量的节点的错误`树`,在那里n节点的数量。`NodeError(我)`是节点的误分类概率`我`。
`NodeProbability`	一个n元向量的节点的概率`树`,在那里n节点的数量。一个节点的概率计算的比例从原始观测数据,满足条件的节点。这一比例调整为任何先验概率分配给每个类。
`NodeRisk`	一个n元向量的风险树中的节点,在哪里n节点的数量。每个节点的风险是杂质的测量(基尼系数或异常)为该节点通过节点概率加权。如果两个种植这棵树,每个节点的风险为零。
`NodeSize`	一个n元向量的节点的大小`树`,在那里n节点的数量。大小的一个节点被定义为观测的数量从数据用来创建树节点满足条件。
`NumNodes`	节点的数量`树`。
`父`	一个n元向量包含每个节点的父节点的数量`树`,在那里n节点的数量。根节点的父节点`0`。
`PredictorNames`	一个单元阵列为预测变量的名称,在它们出现的顺序`X`。
`之前`	每个类的先验概率数值向量。元素的顺序`之前`对应于类的顺序`一会`。元素的数量`之前`在响应中是独特的类的数量。这个属性是只读的。
`PruneAlpha`	每修剪水平数值向量和一个元素。如果修剪水平范围从0到米,然后`PruneAlpha`有米+ 1元素按升序排序。`PruneAlpha (1)`是修剪级别0(没有修剪),`PruneAlpha (2)`修剪水平1,等等。
`PruneList`	一个n元数值向量的每个节点修剪水平`树`,在那里n节点的数量。修剪水平范围从0(没有修剪)米,在那里米是最深的叶和根节点之间的距离。
`ResponseName`	特征向量描述变量的响应`Y`。
`ScoreTransform`	函数处理转变分数,或字符向量代表一个内置的变换函数。`“没有”`意味着没有转换;同样,`“没有”`意味着`@ x (x)`。的内置转换函数和自定义的语法转换函数,看看`fitctree`。添加或更改`ScoreTransform`函数使用点符号: ctree。ScoreTransform = '函数”或ctree。ScoreTransform = @函数
`SurrogateCutCategories`	一个n元胞数组的类别用于替代分裂`树`,在那里n节点的数量在吗`树`。为每个节点`k`,`SurrogateCutCategories {k}`是一个单元阵列。的长度`SurrogateCutCategories {k}`等于代理预测在这个节点的数量。每个元素的`SurrogateCutCategories {k}`要么是一个空的特征向量连续代理预测,或者是一个双元素单元阵列与类别分类代理预测。双元素单元阵列列表的第一个元素类别分配给这个代理的左子双元素细胞分裂和第二个元素数组列表类别分配到正确的孩子通过这个代理。代孕的顺序分离变量在每个节点匹配变量的顺序`SurrogateCutVar`。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogateCutCategories`包含一个空单元。
`SurrogateCutFlip`	一个n元胞数组的数值减少作业用来替代分裂`树`,在那里n节点的数量在吗`树`。为每个节点`k`,`SurrSurrogateCutFlip {k}`是一个数值向量。的长度`SurrogateCutFlip {k}`等于代理预测在这个节点的数量。每个元素的`SurrogateCutFlip {k}`零分类代理预测,或一个数字削减分配连续代理预测。数字减少作业可以是- 1或+ 1。对于每一个代理和一个数字C基于连续的预测变量Z选择,左边的孩子Z<C和削减分配代理分+ 1,或者Z≥C和这个代理的切割作业是1。同样,选择正确的孩子Z≥C和削减分配代理分+ 1,或者Z<C和这个代理的切割作业是1。代孕的顺序分离变量在每个节点匹配变量的顺序`SurrogateCutPredictor`。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogateCutFlip`包含一个空数组。
`SurrogateCutPoint`	一个n元胞数组的数值用于替代分裂`树`,在那里n节点的数量在吗`树`。为每个节点`k`,`SurrogateCutPoint {k}`是一个数值向量。的长度`SurrogateCutPoint {k}`等于代理预测在这个节点的数量。每个元素的`SurrogateCutPoint {k}`要么是`南`分类代理预测,或连续的数字减少代理预测。对于每一个代理和一个数字C基于连续的预测变量Z选择,左边的孩子Z<C和`SurrogateCutFlip`这个代理分+ 1,或者Z≥C和`SurrogateCutFlip`这个代理分裂是1。同样,选择正确的孩子Z≥C和`SurrogateCutFlip`这个代理分+ 1,或者Z<C和`SurrogateCutFlip`这个代理分裂是1。代孕的顺序分离变量在每个节点相匹配的顺序返回的变量`SurrogateCutPredictor`。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogateCutPoint`包含一个空单元。
`SurrogateCutType`	一个n元胞数组表示类型的代理将在每个节点`树`,在那里n节点的数量在吗`树`。为每个节点`k`,`SurrogateCutType {k}`是单元阵列类型的代理变量分裂在这个节点。预测的变量排序测量和最优预测降序排列,并仅包含了变量与积极的预测指标。代孕的顺序分离变量在每个节点匹配变量的顺序`SurrogateCutPredictor`。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogateCutType`包含一个空单元。代孕可以分裂类型`“连续”`如果削减中定义的形式`Z`<`V`为一个变量`Z`和减少点`V`或`“分类”`如果削减由是否定义`Z`以一组类别的一个值。
`SurrogateCutPredictor`	一个n元胞数组的变量的名称用于代理在每个节点分裂`树`,在那里n节点的数量在吗`树`。每个元素的`SurrogateCutPredictor`是一个单元阵列的名字在这个节点代理变量分裂。预测的变量排序测量和最优预测降序排列,并仅包含了变量与积极的预测指标。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogateCutPredictor`包含一个空单元。
`SurrogatePredictorAssociation`	一个n元胞数组的代理将协会的预测措施`树`,在那里n节点的数量在吗`树`。为每个节点`k`,`SurrogatePredictorAssociation {k}`是一个数值向量。的长度`SurrogatePredictorAssociation {k}`等于代理预测在这个节点的数量。每个元素的`SurrogatePredictorAssociation {k}`给出了预测的最优分割这代理分裂之间的联系。代孕的顺序分离变量在每个节点变量的顺序`SurrogateCutPredictor`。在这个节点没有出现optimal-split变量。nonbranch(叶)节点,`SurrogatePredictorAssociation`包含一个空单元。

对象的功能

`compareHoldout`	比较两种分类模型使用新数据的精度
`边缘`	分类的优势
`收集`	收集的属性统计和机器学习工具对象从GPU
`石灰`	本地可model-agnostic解释(石灰)
`损失`	分类错误
`保证金`	分类的利润率
`partialDependence`	计算部分依赖
`plotPartialDependence`	创建部分依赖图(PDP)和个人条件期望(ICE)情节
`预测`	预测使用分类树标签
`predictorImportance`	估计预测重要的分类树
`沙普利`	沙普利值
`surrogateAssociation`	意味着预测衡量代理协会分类树的分裂
`更新`	更新模型参数代码生成
`视图`	视图分类树

复制语义

价值。学习如何价值类影响复制操作,明白了复制对象。

例子

全部折叠

构造一个紧凑的分类树

打开生活的脚本

构造一个紧凑的费舍尔虹膜数据的分类树。

负载fisheriris树= fitctree(量、种类);ctree =紧凑(树);

比较结果树的大小和原来的树。

t =谁(“树”);% t。字节=树字节的大小c =谁(“ctree”);% c。字节= ctree的大小(以字节为单位[c。字节t.bytes]

ans =1×25097 11762

紧凑的树小于原来的树。

扩展功能

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

使用笔记和限制:

的预测和更新代码生成功能支持。金宝app
分类树模型的集成预测模型金宝app^®,你可以使用ClassificationTree预测块的统计和机器学习的图书馆或MATLAB工具箱™^®功能块的预测函数。
当你训练一个分类树fitctree以下限制适用。
- 的值“ScoreTransform”名称-值对的论点不能一个匿名函数。对于定点代码生成,“ScoreTransform”值不能“invlogit”。
- 你不能使用代理分裂,的值“代孕”名称-值对论点必须“关闭”。
- 定点代码生成和代码生成与编码器配置,以下额外的限制。
  - 分类预测(逻辑,分类,字符,字符串,或细胞不支持)。金宝app你不能使用“CategoricalPredictors”名称-值参数。包括分类预测模型中,利用预处理dummyvar在拟合模型。
  - 类标签分类不支持的数据类型。金宝app训练数据的类标签值(资源描述或Y)和的值“类名”名称-值参数不能与数组分类数据类型。

有关更多信息,请参见介绍代码生成。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

使用笔记和限制:

以下对象函数完全支持GPU数组:金宝app
以下对象函数提供有限的支持GPU数组:金宝app

有关更多信息,请参见运行在GPU MATLAB函数(并行计算工具箱)。

另请参阅

ClassificationTree|fitctree|紧凑的|compareHoldout

介绍了R2011a

CompactClassificationTree

描述

建设

输入参数

属性

对象的功能

复制语义

例子

构造一个紧凑的分类树

更多关于

杂质和节点错误

扩展功能

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

另请参阅

统计和机器学习工具箱文档

金宝app

掌握机器学习:一个循序渐进的指导与MATLAB

CompactClassificationTree

描述

建设

输入参数

属性

对象的功能

复制语义

例子

构造一个紧凑的分类树

更多关于

杂质和节点错误

扩展功能

C / c++代码生成生成C和c++代码使用MATLAB®编码器™。

GPU数组加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

另请参阅

统计和机器学习工具箱文档

金宝app

掌握机器学习:一个循序渐进的指导与MATLAB

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。