主要内容

RegressionEnsemble

包:classreg.learning.regr
超类:CompactRegressionEnsemble

整体回归

描述

RegressionEnsemble结合一组训练过的弱学习器模型和这些学习器训练过的数据。它可以通过聚合来自弱学习器的预测来预测新数据的集成响应。

建设

使用创建回归集成对象fitrensemble

属性

BinEdges

的单元格数组指定的数值预测器的Bin边p数字向量,其中p是预测因子的数量。每个向量都包含数值预测器的bin边。类别预测器的单元格数组中的元素为空,因为软件不收纳类别预测器。

类型时,软件才会对数值预测器进行分类“NumBins”在使用树学习器训练模型时,名称-值参数作为正整数标量。的BinEdges属性为空“NumBins”值为空(默认值)。

您可以重新生成已归档的预测器数据Xbinned通过使用BinEdges训练模型的属性mdl

X = mdl.X;%预测数据Xbinned = 0(大小(X));edges = mdl.BinEdges;查找已分类预测符的索引。idxNumeric = find(~cellfun(@isempty,edges));if iscolumn(idxNumeric) idxNumeric = idxNumeric';end for j = idxNumeric x = x (:,j);如果x是一个表,则将x转换为数组。If stable(x) x = table2array(x);将x分组到箱子中离散化函数。Xbinned =离散化(x,[-inf;边缘{};正]);Xbinned(:,j) = Xbinned;结束
Xbinned包含数值预测器的容器索引,范围从1到容器数。Xbinned类别预测器的值为0。如果X包含S,然后是对应的Xbinned值是年代。

CategoricalPredictors

分类预测指标,指定为正整数向量。CategoricalPredictors包含与包含分类预测器的预测器数据列对应的索引值。如果没有一个预测符是分类的,则此属性为空([]).

CombineWeights

描述集合如何结合学习者预测的字符向量。

ExpandedPredictorNames

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型对分类变量使用编码,则ExpandedPredictorNames包括描述展开变量的名称。否则,ExpandedPredictorNamesPredictorNames

FitInfo

拟合信息的数字数组。的FitInfoDescription属性描述此数组的内容。

FitInfoDescription

字符向量描述的含义FitInfo数组中。

LearnerNames

集合中包含弱学习器名称的字符向量的单元数组。每个学习者的名称只出现一次。例如,如果你有100棵树的集合,LearnerNames{'树'}

HyperparameterOptimizationResults

超参数的交叉验证优化的描述,存储为BayesianOptimization对象或超参数及相关值的表。当OptimizeHyperparameters名称-值对在创建时是非空的。属性的设置HyperparameterOptimizationOptions创建时的名称-值对:

  • “bayesopt”(默认)-类的对象BayesianOptimization

  • “gridsearch”“randomsearch”-使用的超参数表,观察到的目标函数值(交叉验证损失),以及从最低(最好)到最高(最差)的观察值排序

方法

带有算法名称的字符向量fitrensemble用于训练整个乐团。

ModelParameters

训练参数实体

NumObservations

包含训练数据中观察数的数字标量。

NumTrained

集合中受过训练的学习者的数量,一个正标量。

PredictorNames

预测变量名称的单元格数组,按它们出现的顺序排列X

ReasonForTermination

描述原因的字符向量fitrensemble停止向集合中添加弱学习器。

正则化

方法的结果的结构规范方法。使用正则化缩小降低复代误差,缩小集合。

ResponseName

具有响应变量名称的字符向量Y

ResponseTransform

转换分数的函数句柄,或表示内置转换函数的字符向量。“没有”表示没有变换;同样,“没有”意味着@ x (x)

添加或更改ResponseTransform函数使用点表示法:

ens.ResponseTransform = @函数

训练有素的

训练有素的学习者,一个单元阵列的紧凑回归模型。

TrainedWeights

集合分配给它的学习器的权重的数字向量。集成通过聚合来自其学习者的加权预测来计算预测的响应。

W

的比例权重,一个有长度的向量n的行数X.的元素之和W1

X

训练集合的预测值的矩阵或表。的每一列X表示一个变量,每一行表示一个观察结果。

Y

具有相同行数的数值列向量X这训练了整个乐团。每一项Y的对应行中的数据是否响应X

对象的功能

紧凑的 创建紧凑的回归集成
crossval 交叉验证集成
cvshrink 交叉验证收缩(修剪)集成
石灰 局部可解释模型不可知解释(LIME)
损失 回归误差
partialDependence 计算部分依赖关系
plotPartialDependence 创建部分依赖图(PDP)和个别条件期望图(ICE)
预测 使用回归模型集成预测响应
predictorImportance 回归集合预测因子重要性的估计
规范 找到最小重替换误差和惩罚项的权重
removeLearners 删除紧凑回归集成的成员
resubLoss 回归误差的再替换
resubPredict 用置换法预测系统的响应
重新开始 简历培训套装
沙普利 沙普利值
缩小 修剪合奏

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部折叠

加载carsmall数据集。考虑一个解释汽车燃油经济性的模型(英里/加仑)利用其重量(重量)及气缸数目(气缸).

负载carsmallX =[重量钢瓶];Y = mpg;

训练一个由100个回归树组成的增强集合LSBoost方法。指定气缸是分类变量。

Mdl = fitrensemble(X,Y,“方法”“LSBoost”...“PredictorNames”, {' W '“C”},“CategoricalPredictors”, 2)
Mdl = RegressionEnsemble PredictorNames: {'W' 'C'} ResponseName: 'Y' CategoricalPredictors: 2 ResponseTransform: 'none' NumObservations: 94 NumTrained: 100 Method: 'LSBoost' LearnerNames: {'Tree'} reasonforterminate: '完成所要求的训练周期数后正常终止。'FitInfo: [100x1 double] FitInfoDescription: {2x1 cell}正则化:[]属性,方法

Mdl是一个RegressionEnsemble模型对象,其中包含训练数据。

Mdl。训练有素的属性,用于存储已训练的回归树的100 × 1单元格向量(CompactRegressionTree模型对象)组成集成。

绘制第一个训练的回归树的图。

视图(Mdl。训练有素的{1},“模式”“图”

图回归树查看器包含一个轴和uimenu、uicontrol类型的其他对象。坐标轴包含36个类型为line, text的对象。

默认情况下,fitrensemble生长浅树,增加树木的整体。

预测4000磅的4缸、6缸和8缸汽车的燃油经济性。

XNew = [4000*ones(3,1)] [4;6;8]];mpgNew = predict(Mdl,XNew)
mpgNew =3×119.5926 18.6388 15.4810

提示

对于回归树的集合,使用训练有素的属性包含的单元格向量ens.NumTrainedCompactRegressionTree模型对象。用于树的文本或图形显示t在单元格向量中,输入

视图(实体。训练有素的{t})

扩展功能

在R2011a中引入