主要内容

ClassificationEnsemble

包:classreg.learning.classif
超类:CompactClassificationEnsemble

集成分类器

描述

ClassificationEnsemble结合一组训练过的弱学习器模型和这些学习器训练过的数据。它可以通过聚合来自弱学习器的预测来预测新数据的集成响应。它存储用于训练的数据,可以计算替代预测,如果需要,还可以恢复训练。

建设

创建分类集成对象(实体)使用fitcensemble

属性

BinEdges

的单元格数组指定的数值预测器的Bin边p数字向量,其中p是预测因子的数量。每个向量都包含数值预测器的bin边。类别预测器的单元格数组中的元素为空,因为软件不收纳类别预测器。

类型时,软件才会对数值预测器进行分类“NumBins”在使用树学习器训练模型时,名称-值参数作为正整数标量。的BinEdges属性为空“NumBins”值为空(默认值)。

您可以重新生成已归档的预测器数据Xbinned通过使用BinEdges训练模型的属性mdl

X = mdl.X;%预测数据Xbinned = 0(大小(X));edges = mdl.BinEdges;查找已分类预测符的索引。idxNumeric = find(~cellfun(@isempty,edges));if iscolumn(idxNumeric) idxNumeric = idxNumeric';end for j = idxNumeric x = x (:,j);如果x是一个表,则将x转换为数组。If stable(x) x = table2array(x);将x分组到箱子中离散化函数。Xbinned =离散化(x,[-inf;边缘{};正]);Xbinned(:,j) = Xbinned;结束
Xbinned包含数值预测器的容器索引,范围从1到容器数。Xbinned类别预测器的值为0。如果X包含S,然后是对应的Xbinned值是年代。

CategoricalPredictors

分类预测指标,指定为正整数向量。CategoricalPredictors包含指示相应预测符是分类的索引值。索引值在1和之间p,在那里p用于训练模型的预测器的数量。如果没有一个预测符是分类的,则此属性为空([]).

一会

元素的列表Y删除副本。一会可以是数字向量、分类向量、逻辑向量、字符数组或字符向量的单元格数组。一会与实参中的数据类型相同Y(该软件将字符串数组视为字符向量的单元格数组。)

CombineWeights

描述如何实体也可以合并弱学习器权重“WeightedSum”“WeightedAverage”

成本

方阵,其中成本(i, j)将一个点分类的成本是多少j如果它真正的阶级是(行对应真实的类,列对应预测的类)。的行和列的顺序成本中类的顺序对应一会.中的行数和列数成本响应中唯一类的数量。此属性是只读的。

ExpandedPredictorNames

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型对分类变量使用编码,则ExpandedPredictorNames包括描述展开变量的名称。否则,ExpandedPredictorNamesPredictorNames

FitInfo

拟合信息的数字数组。的FitInfoDescription属性描述此数组的内容。

FitInfoDescription

字符向量描述的含义FitInfo数组中。

HyperparameterOptimizationResults

超参数的交叉验证优化的描述,存储为BayesianOptimization对象或超参数及相关值的表。当OptimizeHyperparameters名称-值对在创建时是非空的。属性的设置HyperparameterOptimizationOptions创建时的名称-值对:

  • “bayesopt”(默认)-类的对象BayesianOptimization

  • “gridsearch”“randomsearch”-使用的超参数表,观察到的目标函数值(交叉验证损失),以及从最低(最好)到最高(最差)的观察值排序

LearnerNames

集合中具有弱学习器名称的字符向量的单元数组。每个学习者的名称只出现一次。例如,如果你有100棵树的集合,LearnerNames{'树'}

方法

描述创建方法的字符向量实体

ModelParameters

训练参数实体

NumObservations

包含训练数据中观察数的数字标量。

NumTrained

培训的弱学习者的数量实体,一个标量。

PredictorNames

预测变量名称的单元格数组,按它们出现的顺序排列X

之前

每个类的先验概率的数字向量。元素的顺序之前中类的顺序对应一会.元素的个数之前响应中唯一类的数量。此属性是只读的。

ReasonForTermination

描述原因的特征向量fitcensemble停止向集合中添加弱学习器。

ResponseName

带有响应变量名称的字符向量Y

ScoreTransform

转换分数的函数句柄,或表示内置转换函数的字符向量。“没有”表示没有变换;同样,“没有”意味着@ x (x).有关内置转换函数的列表和自定义转换函数的语法,请参见fitctree

添加或更改ScoreTransform函数使用点表示法:

ens.ScoreTransform = '函数

ens.ScoreTransform = @函数

训练有素的

训练分类模型的细胞向量。

  • 如果方法“LogitBoost”“GentleBoost”,然后ClassificationEnsemble存储训练有素的学习者jCompactRegressionLearner对象的属性训练有素的{j.也就是说,接触受过训练的学习者j,使用ens.Trained {j}。CompactRegressionLearner

  • 否则,细胞向量的细胞包含相应的、紧凑的分类模型。

TrainedWeights

中弱学习者训练权重的数字向量实体TrainedWeightsT元素,T弱学习者的数量在吗学习者

UsePredForLearner

大小逻辑矩阵P——- - - - - -NumTrained,在那里P训练数据中预测器(列)的数量是多少XUsePredForLearner (i, j)真正的当学习者j使用预测,并且是否则。对于每个学习器,预测器的顺序与训练数据中的列相同X

如果集合不是类型子空间,所有在UsePredForLearner真正的

W

按比例缩小的权重,一个有长度的向量n的行数X.的元素之和W1

X

训练集合的预测器值的矩阵或表。的每一列X表示一个变量,每一行表示一个观察结果。

Y

数字向量、分类向量、逻辑向量、字符数组或字符向量的单元格数组。每行Y的对应行的分类X

对象的功能

紧凑的 紧凑分类系统
compareHoldout 比较使用新数据的两种分类模型的准确性
crossval 旨在合奏
边缘 分类的优势
收集 收集属性统计和机器学习工具箱来自GPU的对象
石灰 局部可解释模型不可知解释(LIME)
损失 分类错误
保证金 分类的利润率
partialDependence 计算部分依赖关系
plotPartialDependence 创建部分依赖图(PDP)和个别条件期望图(ICE)
预测 使用分类模型集成对观测数据进行分类
predictorImportance 决策树分类集合中预测因子重要性的估计
resubEdge 通过置换分类边缘
resubLoss 再置换导致的分类错误
resubMargin 再置换分类边际
resubPredict 在分类模型集合中对观测数据进行分类
重新开始 简历培训套装
沙普利 沙普利值
testckfold 通过重复交叉验证比较两种分类模型的准确性

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部折叠

加载电离层数据集。

负载电离层

使用所有测量值和方法训练100个分类树的增强集合AdaBoostM1方法。

Mdl = fitcensemble(X,Y,“方法”“AdaBoostM1”
Mdl = ClassificationEnsemble ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'b' 'g'} ScoreTransform: 'none' NumObservations: 351 NumTrained: 100 Method: 'AdaBoostM1' LearnerNames: {'Tree'} reasonforterminate: '完成所要求的训练周期数后正常终止。'FitInfo: [100x1 double] FitInfoDescription: {2x1 cell}属性,方法

Mdl是一个ClassificationEnsemble模型对象。

Mdl。Trained属性,用于存储已训练分类树的100 × 1单元格向量(CompactClassificationTree模型对象)组成集成。

绘制第一个训练的分类树的图。

视图(Mdl。训练有素的{1},“模式”“图”

图分类树查看器包含一个axis对象和其他类型为uimenu、uicontrol的对象。axis对象包含36个line, text类型的对象。

默认情况下,fitcensemble生长浅树,增加树木的整体。

预测的均值的标签X

predMeanX = predict(Mdl,mean(X))
predMeanX =1x1单元阵列{' g '}

提示

对于分类树的集合,使用训练有素的的属性实体存储一个ens.NumTrained-by-1细胞向量的紧凑分类模型。用于树的文本或图形显示t在单元格向量中,输入:

  • 视图(实体。训练有素的{t} .CompactRegressionLearner)用于使用LogitBoost或GentleBoost聚合的集合。

  • 视图(实体。训练有素的{t})用于所有其他聚合方法。

扩展功能

版本历史

在R2011a中引入

全部展开

R2022a的行为发生了变化