ClassificationEnsemble

包:classreg.learning.classif
超类:CompactClassificationEnsemble

集成分类器

展开全部页面

描述

ClassificationEnsemble结合一组训练过的弱学习器模型和这些学习器训练过的数据。它可以通过聚合来自弱学习器的预测来预测新数据的集成响应。它存储用于训练的数据，可以计算替代预测，如果需要，还可以恢复训练。

建设

创建分类集成对象(实体)使用fitcensemble．

属性

`BinEdges`	的单元格数组指定的数值预测器的Bin边p数字向量，其中p是预测因子的数量。每个向量都包含数值预测器的bin边。类别预测器的单元格数组中的元素为空，因为软件不收纳类别预测器。类型时，软件才会对数值预测器进行分类`“NumBins”`在使用树学习器训练模型时，名称-值参数作为正整数标量。的`BinEdges`属性为空`“NumBins”`值为空(默认值)。您可以重新生成已归档的预测器数据`Xbinned`通过使用`BinEdges`训练模型的属性`mdl`． X = mdl.X;%预测数据Xbinned = 0(大小(X));edges = mdl.BinEdges;查找已分类预测符的索引。idxNumeric = find(~cellfun(@isempty,edges));if iscolumn(idxNumeric) idxNumeric = idxNumeric';end for j = idxNumeric x = x (:，j);如果x是一个表，则将x转换为数组。If stable(x) x = table2array(x);将x分组到箱子中`离散化`函数。Xbinned =离散化(x，[-inf;边缘{};正]);Xbinned(:，j) = Xbinned;结束 `Xbinned`包含数值预测器的容器索引，范围从1到容器数。`Xbinned`类别预测器的值为0。如果`X`包含`南`S，然后是对应的`Xbinned`值是`南`年代。
`CategoricalPredictors`	分类预测指标，指定为正整数向量。`CategoricalPredictors`包含指示相应预测符是分类的索引值。索引值在1和之间`p`,在那里`p`用于训练模型的预测器的数量。如果没有一个预测符是分类的，则此属性为空(`［］`）.
`一会`	元素的列表`Y`删除副本。`一会`可以是数字向量、分类向量、逻辑向量、字符数组或字符向量的单元格数组。`一会`与实参中的数据类型相同`Y`．(该软件将字符串数组视为字符向量的单元格数组。)
`CombineWeights`	描述如何`实体`也可以合并弱学习器权重`“WeightedSum”`或`“WeightedAverage”`．
`成本`	方阵，其中`成本(i, j)`将一个点分类的成本是多少`j`如果它真正的阶级是`我`(行对应真实的类，列对应预测的类)。的行和列的顺序`成本`中类的顺序对应`一会`．中的行数和列数`成本`响应中唯一类的数量。此属性是只读的。
`ExpandedPredictorNames`	扩展的预测器名称，存储为字符向量的单元格数组。如果模型对分类变量使用编码，则`ExpandedPredictorNames`包括描述展开变量的名称。否则,`ExpandedPredictorNames`和`PredictorNames`．
`FitInfo`	拟合信息的数字数组。的`FitInfoDescription`属性描述此数组的内容。
`FitInfoDescription`	字符向量描述的含义`FitInfo`数组中。
`HyperparameterOptimizationResults`	超参数的交叉验证优化的描述，存储为`BayesianOptimization`对象或超参数及相关值的表。当`OptimizeHyperparameters`名称-值对在创建时是非空的。属性的设置`HyperparameterOptimizationOptions`创建时的名称-值对: `“bayesopt”`(默认)-类的对象`BayesianOptimization` `“gridsearch”`或`“randomsearch”`-使用的超参数表，观察到的目标函数值(交叉验证损失)，以及从最低(最好)到最高(最差)的观察值排序
`LearnerNames`	集合中具有弱学习器名称的字符向量的单元数组。每个学习者的名称只出现一次。例如，如果你有100棵树的集合，`LearnerNames`是`{'树'}`．
`方法`	描述创建方法的字符向量`实体`．
`ModelParameters`	训练参数`实体`．
`NumObservations`	包含训练数据中观察数的数字标量。
`NumTrained`	培训的弱学习者的数量`实体`，一个标量。
`PredictorNames`	预测变量名称的单元格数组，按它们出现的顺序排列`X`．
`之前`	每个类的先验概率的数字向量。元素的顺序`之前`中类的顺序对应`一会`．元素的个数`之前`响应中唯一类的数量。此属性是只读的。
`ReasonForTermination`	描述原因的特征向量`fitcensemble`停止向集合中添加弱学习器。
`ResponseName`	带有响应变量名称的字符向量`Y`．
`ScoreTransform`	转换分数的函数句柄，或表示内置转换函数的字符向量。`“没有”`表示没有变换;同样,`“没有”`意味着`@ x (x)`．有关内置转换函数的列表和自定义转换函数的语法，请参见`fitctree`．添加或更改`ScoreTransform`函数使用点表示法: ens.ScoreTransform = '函数＇或 ens.ScoreTransform = @函数
`训练有素的`	训练分类模型的细胞向量。如果`方法`是`“LogitBoost”`或`“GentleBoost”`,然后`ClassificationEnsemble`存储训练有素的学习者`j`在`CompactRegressionLearner`对象的属性`训练有素的{j｝`．也就是说，接触受过训练的学习者`j`,使用`ens.Trained {j}。CompactRegressionLearner`．否则，细胞向量的细胞包含相应的、紧凑的分类模型。
`TrainedWeights`	中弱学习者训练权重的数字向量`实体`．`TrainedWeights`有`T`元素,`T`弱学习者的数量在吗`学习者`．
`UsePredForLearner`	大小逻辑矩阵`P`——- - - - - -`NumTrained`,在那里`P`训练数据中预测器(列)的数量是多少`X`．`UsePredForLearner (i, j)`是`真正的`当学习者`j`使用预测`我`，并且是`假`否则。对于每个学习器，预测器的顺序与训练数据中的列相同`X`．如果集合不是类型`子空间`，所有在`UsePredForLearner`是`真正的`．
`W`	按比例缩小的`权重`，一个有长度的向量`n`的行数`X`．的元素之和`W`是`1`．
`X`	训练集合的预测器值的矩阵或表。的每一列`X`表示一个变量，每一行表示一个观察结果。
`Y`	数字向量、分类向量、逻辑向量、字符数组或字符向量的单元格数组。每行`Y`的对应行的分类`X`．

对象的功能

`紧凑的`	紧凑分类系统
`compareHoldout`	比较使用新数据的两种分类模型的准确性
`crossval`	旨在合奏
`边缘`	分类的优势
`收集`	收集属性统计和机器学习工具箱来自GPU的对象
`石灰`	局部可解释模型不可知解释(LIME)
`损失`	分类错误
`保证金`	分类的利润率
`partialDependence`	计算部分依赖关系
`plotPartialDependence`	创建部分依赖图(PDP)和个别条件期望图(ICE)
`预测`	使用分类模型集成对观测数据进行分类
`predictorImportance`	决策树分类集合中预测因子重要性的估计
`resubEdge`	通过置换分类边缘
`resubLoss`	再置换导致的分类错误
`resubMargin`	再置换分类边际
`resubPredict`	在分类模型集合中对观测数据进行分类
`重新开始`	简历培训套装
`沙普利`	沙普利值
`testckfold`	通过重复交叉验证比较两种分类模型的准确性

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象．

例子

全部折叠

列车提升分类集合

打开实时脚本

加载电离层数据集。

负载电离层

使用所有测量值和方法训练100个分类树的增强集合AdaBoostM1方法。

Mdl = fitcensemble(X,Y，“方法”，“AdaBoostM1”）

Mdl = ClassificationEnsemble ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'b' 'g'} ScoreTransform: 'none' NumObservations: 351 NumTrained: 100 Method: 'AdaBoostM1' LearnerNames: {'Tree'} reasonforterminate: '完成所要求的训练周期数后正常终止。'FitInfo: [100x1 double] FitInfoDescription: {2x1 cell}属性，方法

Mdl是一个ClassificationEnsemble模型对象。

Mdl。Trained属性，用于存储已训练分类树的100 × 1单元格向量(CompactClassificationTree模型对象)组成集成。

绘制第一个训练的分类树的图。

视图(Mdl。训练有素的{1｝，“模式”，“图”）

图分类树查看器包含一个axis对象和其他类型为uimenu、uicontrol的对象。axis对象包含36个line, text类型的对象。

默认情况下,fitcensemble生长浅树，增加树木的整体。

预测的均值的标签X．

predMeanX = predict(Mdl,mean(X))

predMeanX =1x1单元阵列{' g '}

提示

对于分类树的集合，使用训练有素的的属性实体存储一个ens.NumTrained-by-1细胞向量的紧凑分类模型。用于树的文本或图形显示t在单元格向量中，输入:

视图(实体。训练有素的{t} .CompactRegressionLearner)用于使用LogitBoost或GentleBoost聚合的集合。
视图(实体。训练有素的{t})用于所有其他聚合方法。

扩展功能

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制:

的预测函数支持代码生成。金宝app
将集成的预测集成到Simulink中金宝app^®，你可以使用ClassificationEnsemble预测块的统计和机器学习工具箱™库或MATLAB^®函数块。预测函数。
当你用fitcensemble，对于集成中使用的弱学习器的代码生成限制也适用于集成。的代码生成部分获得更多详细信息ClassificationKNN，CompactClassificationDiscriminant,CompactClassificationTree．
对于定点代码生成，必须使用树学习器训练集成。

有关更多信息，请参见代码生成简介．

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

使用注意事项和限制:

以下对象函数完全支持GPU阵列:金宝app
以下对象函数对GPU阵列提供有限的支持:金宝app

有关更多信息，请参见在图形处理器上运行MATLAB函数(并行计算工具箱)．

版本历史

在R2011a中引入

全部展开

R2022a:`成本`属性存储用户指定的成本矩阵

R2022a的行为发生了变化

从R2022a开始，成本属性存储用户指定的代价矩阵，以便您可以使用指定的代价值计算观察到的错误分类代价。软件存储归一化先验概率(之前)和观察权重(W)，不反映成本矩阵中所描述的惩罚。错误分类代价的计算方法请参见R2022a发布说明分类模型对象函数:计算观测到的错误分类代价．

请注意，模型训练没有改变，因此，类之间的决策边界没有改变。

对于训练，拟合函数通过合并指定成本矩阵中描述的惩罚来更新指定的先验概率，然后将先验概率和观察权重归一化。这种行为没有改变。在以前的版本中，软件将默认成本矩阵存储在成本属性，并存储用于训练的先验概率和观察权重之前而且W属性,分别。从R2022a开始，软件按原样存储用户指定的成本矩阵，并存储不反映成本惩罚的标准化先验概率和观察权重。详情请参见错误分类成本矩阵，先验概率和观察权重．

一些对象函数使用成本，之前,W属性:

的损失而且resubLoss函数使用存储在成本属性LossFun名称-值参数为“classifcost”或“mincost”．
的损失而且边缘函数使用存储在之前属性将输入数据的观测权重归一化。
的resubLoss而且resubEdge函数使用存储在W财产。

如果在训练分类模型时指定非默认代价矩阵，则对象函数返回的值与以前版本的值不同。

如果您希望软件像以前版本中那样处理成本矩阵、先验概率和观察权重，请调整非默认成本矩阵的先验概率和观察权重，如中所述调整错误分类成本矩阵的先验概率和观测权重．然后，当你训练一个分类模型，指定调整的先验概率和观察权重使用之前而且权重分别使用名称-值参数，并使用默认代价矩阵。

另请参阅

ClassificationTree|fitcensemble|CompactClassificationEnsemble|视图|compareHoldout