主要内容

CompactClassificationEnsemble

包:classreg.learning.classif

紧分类集成类

描述

分类集成(类的)的紧凑版本ClassificationEnsemble)。精简版不包括训练分类集成的数据。因此,您无法使用紧凑的分类集成执行某些任务,例如交叉验证。使用紧凑的分类集成来对新数据进行预测(分类)。

建设

实体=紧凑(fullEns)从一个完整的决策集成中构建一个紧凑的决策集成。

输入参数

fullEns

fitcensemble

属性

CategoricalPredictors

分类预测指标,指定为正整数的向量。CategoricalPredictors包含与包含分类预测器的预测器数据列对应的索引值。如果没有一个预测器是直言的,那么这个属性是空的([])。

一会

元素的列表Y删除重复的。一会可以是数字向量、分类变量向量、逻辑向量、字符数组或字符向量的单元格数组。一会是否与参数中的数据具有相同的数据类型Y(该软件将字符串数组视为字符向量的单元数组。)

CombineWeights

描述如何实体也可以结合弱学习者权重“WeightedSum”“WeightedAverage”

成本

方阵,成本(i, j)将一个分数分类的成本是多少j如果它的真值是(行对应于真实类,列对应于预测类)。的行和列的顺序成本中的类的顺序一会。的行数和列数成本是响应中惟一类的数量。此属性是只读的。

ExpandedPredictorNames

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型对分类变量使用编码,那么ExpandedPredictorNames包括描述扩展变量的名称。否则,ExpandedPredictorNamesPredictorNames

NumTrained

训练有素的弱学习者的数量实体一个标量。

PredictorNames

预测变量名称的单元格数组,按它们出现的顺序排列X

之前

每个类的先验概率的数值向量。元素的顺序之前中的类的顺序一会。元素的个数之前是响应中惟一类的数量。此属性是只读的。

ResponseName

带有响应变量名称的字符向量Y

ScoreTransform

转换分数的函数句柄,或表示内置转换函数的字符向量。“没有”意味着没有转换;同样,“没有”意味着@ x (x)。有关内置转换函数的列表和自定义转换函数的语法,请参见fitctree

添加或更改ScoreTransform函数使用点表示法:

ens.ScoreTransform = '函数

ens.ScoreTransform = @函数

训练有素的

训练过的分类模型的细胞载体。

  • 如果方法“LogitBoost”“GentleBoost”,然后CompactClassificationEnsemble商店训练学习者jCompactRegressionLearner中的对象的属性训练有素的{j}。也就是说,接触训练有素的学习者j,使用ens.Trained {j} .CompactRegressionLearner

  • 否则,细胞载体的细胞包含相应的、紧凑的分类模型。

TrainedWeights

弱学习者的训练权值的数值向量实体TrainedWeightsT元素,T弱势学习者的人数在多少学习者

UsePredForLearner

尺寸逻辑矩阵P——- - - - - -NumTrained,在那里P训练数据中预测器的数量(列)是多少XUsePredForLearner (i, j)真正的当学习者j使用预测,是否则。对于每个学习者,预测器的顺序与训练数据中的列相同X

如果合奏不符合类型子空间,所有条目UsePredForLearner真正的

对象的功能

边缘 分类的优势
损失 分类错误
保证金 分类的利润率
partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望图(ICE)
预测 使用分类模型集成对观测数据进行分类
predictorImportance 决策树分类集成中预测器重要性的估计
removeLearners 移除紧凑分类集合的成员

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部折叠

创建一个紧凑的分类集成,以有效地对新数据进行预测。

加载电离层数据集。

负载电离层

使用所有的测量值和AdaBoostM1方法。

Mdl = fitcensemble (X, Y,“方法”,“AdaBoostM1”)
Mdl = ClassificationEnsemble ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'b' 'g'} ScoreTransform: 'none' NumObservations: 351 numtraining: 100 Method: 'AdaBoostM1' LearnerNames: {'Tree'} ReasonForTermination: '在完成请求的训练周期后正常终止。` FitInfo: [100x1 double] FitInfoDescription: {2x1 cell}属性,方法

Mdl是一个ClassificationEnsemble模型对象,其中包含训练数据。

创建一个紧凑的版本Mdl

CMdl =紧凑(Mdl)
[] ClassNames: {'b' 'g'} ScoreTransform: 'none' numtraining: 100属性,方法

CMdl是一个CompactClassificationEnsemble模型对象。CMdl几乎和Mdl。一个例外是CMdl不存储训练数据。

比较所消耗的空间量MdlCMdl

mdlInfo =谁(“Mdl”);cMdlInfo =谁(“CMdl”);[mdlInfo。字节cMdlInfo.bytes]
ans =1×2877937 631686

MdlCMdl

CMdl.Trained储存训练过的分类树(CompactClassificationTree模型对象)组成Mdl

显示紧凑整体中第一个树的图形。

视图(CMdl.Trained {1},“模式”,“图”);

默认情况下,fitcensemble种植浅树以增加树木的集合。

预测的平均值的标签X使用紧凑的套装。

predMeanX =预测(CMdl,意味着(X))
predMeanX =1 x1单元阵列{' g '}

提示

对于分类树的集合训练有素的的属性实体存储一个ens.NumTrained-by-1细胞载体的紧凑分类模型。用于树的文本或图形显示t在细胞向量中输入:

  • 视图(ens.Trained {t} .CompactRegressionLearner)用于使用LogitBoost或GentleBoost聚合的集合。

  • 视图(ens.Trained {t})对于所有其他聚合方法。

扩展功能

介绍了R2011a