主要内容

CompactTreeBagger类

紧凑的整体决策树生长的引导聚合

描述

CompactTreeBagger类是一个轻量级的类包含使用树木生长TreeBaggerCompactTreeBagger不保存任何信息如何TreeBagger增长的决策树。它不包含输入数据用于植树,它也不包含训练参数如最小叶大小或数量的变量抽样随机分割为每一个决定。你只能使用CompactTreeBagger预测的反应训练合奏了新的数据X和其他相关功能。

CompactTreeBagger让你将训练整体保存到磁盘,或以任何其他方式使用它,而丢弃培训数据和各种参数的配置无关的预测反应的成年。这样可以减少存储和内存需求,尤其是对乐团训练在大型数据集。

建设

CompactTreeBagger 创建CompactTreeBagger对象

CMdl=紧凑(Mdl)创建一个紧凑的版本Mdl,一个TreeBagger模型对象。你可以预测回归使用CMdl完全可以使用Mdl。然而,由于CMdl不包含训练数据,你无法执行一些操作,比如让out-of-bag预测使用oobPredict

对象的功能

结合 结合两个乐团
错误 错误(错误分类概率或MSE)
保证金 分类保证金
mdsprox 多维标度的距离矩阵
meanMargin 意思是分类保证金
outlierMeasure 离群值测量数据整体的决策树
partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望(ICE)情节
预测 使用的袋装决策树预测反应
接近 距离矩阵的决策树中的数据
setDefaultYfit 设置默认值预测

属性

一会

一会属性是一个单元阵列响应变量包含类名Y提供给TreeBagger。这个属性是空的回归树。

DefaultYfit

DefaultYfit属性控制预测价值CompactTreeBagger返回时预测是不可能的,例如当预测方法需要预测的观察只有通过假值矩阵“useifort”论点。

分类,你可以设定这个属性“MostPopular”。如果你选择“MostPopular”(默认),属性值变得最可能的类的名称在训练数据。

对于回归,可以将此属性设置为任何数字标量。默认是对训练数据响应的均值。

DeltaCriterionDecisionSplit

DeltaCriterionDecisionSplit属性是一个数值数组大小为1×-据nvar求和分割标准的变化对每个变量分裂,平均在整个乐团的种植树木。

方法

方法属性是“分类”分类集合体和“回归”回归集合体。

NumPredictorSplit

NumPredictorSplit属性是一个数值数组大小为1×-据nvar,每个元素提供了数量的分歧在这个预测求和所有树木。

NumTrees

NumTrees房地产是一个标量的数量等于合奏的决策树。

PredictorNames

PredictorNames属性是一个单元阵列包含预测变量的名称(特性)。这些名字是取自可选“名字”参数,提供给TreeBagger。默认的名字x1的,“x2”等。

SurrogateAssociation

SurrogateAssociation房地产是一个矩阵的大小据nvar——- - - - - -据nvar变量协会预测措施,平均在整个乐团的种植树木。如果你变得合奏“代孕”“上”每棵树,这个矩阵是满了协会的预测措施平均代理分裂。如果你变得合奏“代孕”“关闭”(默认),SurrogateAssociation是斜的。

属性是一个细胞大小的数组NumTrees1包含的树木。

例子

全部折叠

为有效地创建一个压缩袋树做出预测新数据。

加载电离层数据集。

负载电离层

列车一袋100使用所有测量和分类树AdaBoostM1方法。

Mdl = TreeBagger (100 X, Y,“方法”,“分类”)
Mdl = TreeBagger合奏与100袋装决策树:训练X: [351 x34]培训Y: [351 x1)方法:分类NumPredictors: 34 NumPredictorsToSample: 6 MinLeafSize: 1 InBagFraction: 1 SampleWithReplacement: 1 ComputeOOBPrediction: 0 ComputeOOBPredictorImportance: 0距离:[]一会:“b”“g”属性,方法

Mdl是一个TreeBagger包含训练数据模型对象,等等。

创建一个紧凑的版本Mdl

CMdl =紧凑(Mdl)
CMdl = CompactTreeBagger合奏与100袋装决策树:方法:分类NumPredictors: 34一会:“b”“g”属性,方法

CMdl是一个CompactTreeBagger模型对象。CMdl几乎是一样的吗Mdl。一个例外是,它不存储训练数据。

比较大量的空间了MdlCMdl

mdlInfo =谁(“Mdl”);cMdlInfo =谁(“CMdl”);[mdlInfo。字节cMdlInfo.bytes]
ans =1×21115742 976936

Mdl消耗更多的空间比CMdl

CMdl.Trees存储训练分类树(CompactClassificationTree模型对象)组成Mdl

显示一个图的第一棵树紧凑模式。

视图(CMdl.Trees {1},“模式”,“图”);

图分类树查看器包含一个坐标轴对象和其他对象类型uimenu uicontrol。坐标轴对象包含60线类型的对象,文本。

默认情况下,TreeBagger深树生长。

预测均值的标签X使用紧凑的合奏。

predMeanX =预测(CMdl,意味着(X))
predMeanX =1 x1单元阵列{' g '}

复制语义

价值。学习如何影响你的使用类的,看到的类比较处理和价值在MATLAB®面向对象编程的文档。

提示

的属性CMdl存储单元向量的CMdl.NumTreesCompactClassificationTreeCompactRegressionTree模型对象。文本或图形显示的树t在细胞中向量,输入

视图(CMdl.Trees {t})

版本历史

全部展开

行为改变R2022a