主要内容

分类符号

包:classreg.learning.classif
超类:压缩分类插入码

集成分类器

描述

分类符号将一组经过训练的弱学习者模型和这些学习者接受训练的数据相结合。它可以通过聚合来自弱学习者的预测来预测新数据的整体反应。它存储用于训练的数据,可以计算恢复替代预测,并可以根据需要恢复训练。

建设

使用。创建分类集成对象fitcensemble

属性

边沿

的单元格数组指定为数值预测器的Bin边p数值向量,p是预测器的数量。每个向量包括一个数字预测器的箱边。用于分类预测器的单元格数组中的元素为空,因为软件没有将分类预测器存储在存储单元中。

只有当您指定“NumBins”当使用树学习器训练模型时,将名称-值参数作为正整数标量。的边沿属性为空“NumBins”值为空(默认)。

您可以复制被分类的预测器数据Xbinned通过使用边沿训练模型的性质mdl

X = mdl.X;%预测数据Xbinned = 0 (size(X));边缘= mdl.BinEdges;找到被分类的预测器的指数。idxNumeric =找到(~ cellfun (@isempty边缘));if iscolumn(idxNumeric) idxNumeric = idxNumeric';end for j = idxNumeric x = x (:,j);%如果x是一个表,则将x转换为数组。If istable(x) x = table2array(x);将x组到bin中离散化函数。xbinned =离散化(x,[无穷;边缘{};正]);Xbinned (:, j) = Xbinned;结束
Xbinned包含数值预测器的仓位索引,范围从1到仓位数。Xbinned对于分类预测器,值为0。如果X包含S,然后对应的Xbinned值是年代。

分类预测因子

分类预测指标,指定为一个正整数向量。分类预测因子包含与包含分类预测器的预测器数据列对应的索引值。如果没有任何预测器是绝对的,则此属性为空([]).

一会

中的元素列表Y删除重复的。一会可以是数字向量、分类向量、逻辑向量、字符数组或字符向量的单元数组。一会与参数中的数据具有相同的数据类型Y(该软件将字符串数组视为字符向量的单元格数组。)

CombineWeights

描述如何实体也可以结合弱学习者权重“加权总和”“加权平均值”

成本

方阵,成本(i, j)将一个点分类的成本是多少j如果它的真实类别是(行对应真实的类,列对应预测的类)。的行和列的顺序成本中类的顺序一会.中的行数和列数成本是响应中唯一类的数量。此属性是只读的。

扩展预测器名称

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型对分类变量使用编码,那么扩展预测器名称包括描述扩展变量的名称。否则,扩展预测器名称是一样的预测器名称

FitInfo

拟合信息的数字数组。的FitInfoDescription属性描述此数组的内容。

FitInfoDescription

字符向量描述的含义FitInfo数组中。

HyperparameterOptimizationResults

超参数的交叉验证优化描述,存储为BayesianOptimization对象或包含超参数和关联值的表。非空的时OptimizeHyperparameters名称-值对在创建时是非空的。的设置HyperparameterOptimizationOptions创建时的名称-值对:

  • “bayesopt”(默认)-类的对象BayesianOptimization

  • “gridsearch”“randomsearch”-使用的超参数表,观测到的目标函数值(交叉验证损失),以及观测值从最低(最好)到最高(最差)的排序

LearnerNames

集合中带有弱学习者名称的字符向量的单元数组。每个学习者的名字只出现一次。例如,如果你有100棵树,LearnerNames{'树'}

方法

描述创建方法的字符向量实体

ModelParameters

训练参数实体

NumObservations

在训练数据中包含观测数的数值标量。

NumTrained

受过训练的弱学习者的数量实体一个标量。

预测器名称

预测器变量名称的单元格数组,按其在X

之前

每个类的先验概率的数字向量。元素的顺序之前中类的顺序一会.元素的数量之前是响应中唯一类的数量。此属性是只读的。

ReasonForTermination

描述原因的字符向量fitcensemble停止把弱学习者加入到合奏中。

ResponseName

带有响应变量名称的字符向量Y

分数变换

用于转换分数的函数句柄,或表示内置转换函数的字符向量。“没有”意味着没有转换;同样,“没有”方法@ x (x).有关内置转换函数的列表和自定义转换函数的语法,请参见fitctree

添加或更改分数变换使用点表示法的函数:

斯考恩斯酒店函数

ens.ScoreTransform=@函数

训练有素的

训练的分类模型的细胞向量。

  • 如果方法“LogitBoost”“GentleBoost”,然后分类符号商店训练学习者jCompactRegressionLearner属性中存储的对象训练{j.也就是说,接触训练有素的学习者j,使用ens.Trained {j}.CompactRegressionLearner

  • 否则,单元向量的单元包含相应的紧凑分类模型。

TrainedWeights

中弱学习者训练权值的数值向量实体TrainedWeightsT元素,T弱学习者的人数在多少学习者

用于学习者

逻辑大小矩阵P-借-NumTrained,在那里P训练数据中预测器(列)的数量X用于学习者(i,j)真正的当学习者j使用预测,是否则。对于每个学习者,预测器的顺序与训练数据中的列相同X

如果集合不是类型子空间,所有输入用于学习者真正的

W

缩放权重,一个具有长度的向量n,中的行数X.元素的和W1

X

训练集合的预测值矩阵或表X表示一个变量,每一行表示一个观察。

Y

数字向量、分类向量、逻辑向量、字符数组或字符向量的单元数组。每一行的Y的对应行的分类X

对象的功能

契约 紧凑的系综分类
compareHoldout 使用新数据比较两种分类模型的准确度
crossval 交叉验证合奏
边缘 分类的优势
石灰 局部可解释的模型不可知解释(LIME)
损失 分类错误
保证金 分类边距
partialDependence 计算部分依赖
局部依赖 创建部分依赖图(PDP)和个人条件期望图(ICE)
预测 使用分类模型的集合对观测结果进行分类
predictorImportance 决策树分类集成中预测器重要性的估计
脱贫工人 删除紧凑分类集合的成员
resubEdge 边的再替换分类
resubLoss 再代换造成的分类错误
再精 再替换的分类边缘
resubPredict 在分类模型集合中对观察进行分类
的简历 恢复训练合奏
沙普利 沙普利值
testckfold 通过重复交叉验证比较两种分类模型的准确率

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部折叠

加载电离层数据集。

负载电离层

使用所有测量值和AdaBoostM1方法。

Mdl=fitcensemble(X,Y,“方法”“AdaBoostM1”
Mdl=ClassificationnSemble ResponseName:'Y'分类预测值:[]类名:{'b''g'}ScoreTransform:'none'NumObjections:351 NumTrained:100方法:'AdaBoostM1'LearnerNames:{'Tree'}ReasonForTermination:'在完成所请求的训练周期数后正常终止。'FitInfo:[100x1 double]FitInfoDescription:{2x1 cell}属性、方法

Mdl是一个分类符号模型对象。

Mdl。Trained是存储经过训练的分类树的100 × 1细胞向量的属性(CompactClassificationTree模型对象)组成集成。

绘制第一个经过训练的分类树的图。

视图(Mdl。训练{1},“模式”“图”

图分类树查看器包含一个轴和其他类型的uimenu, uicontrol对象。轴包含36个类型为line, text的对象。

默认情况下,fitcensemble种植浅的树木,以增强树木的整体效果。

预测的平均值的标签X

predMeanX =预测(Mdl,意味着(X))
predMeanX =1x1单元阵列{'g'}

提示

对于分类树的集合训练有素的的属性实体储存裸体的紧凑分类模型的-by-1细胞向量。用于树的文本或图形显示t在细胞向量中,输入:

  • 视图(欧洲标准){t} .CompactRegressionLearner)用于使用LogitBoost或GentleBoost聚合的集成。

  • 视图(欧洲标准){t})用于所有其他聚合方法。

扩展功能

介绍了R2011a