主要内容

RegressionEnsemble

包:classreg.learning.regr
超类:compactregressionensemble

整体回归

描述

RegressionEnsemble结合一组训练过的弱学习者模型和这些学习者训练过的数据。它可以通过聚合弱学习者的预测来预测新数据的集成响应。

建造

使用。创建回归集成对象fitrensemble

特性

BinEdges

的单元格数组指定为数值预测器的Bin边p数字向量,在哪里p是预测器的数量。每个向量包括一个数字预测器的箱边。用于分类预测器的单元格数组中的元素为空,因为软件没有将分类预测器存储在存储单元中。

只有当您指定'numbins'名称 - 值参数作为带有树学习者培训模型时的正整数标量。的BinEdges房产是空的'numbins'值为空(默认)。

您可以重现Binned Predictor数据Xbinned通过使用BinEdges训练模型的性质mdl

x = mdl.x;%predictor数据xbinned = zeros(size(x));边缘= mdl.bineges;%查找箱预测因子的指数。idxnumeric = find(〜cellfun(@ isempty,边));如果是iscumn(idxnumeric)idxnumeric = idxnumeric';j = idxnumeric x = x(:,j);如果x是表,%将x转换为数组。如果是Istable(x)x = table2array(x);结束%X通过使用X进入垃圾箱离散化函数。xbinned =离散化(x,[ -  inf;边缘{j}; inf]);Xbinned(:,j)= xbinned;结尾
Xbinned包含用于数字预测器的容器索引,范围从1到容器数量。Xbinned对于分类预测器,值为0。如果X包含s,然后相应的Xbinned值是s。

CategoricalPredictors

分类预测索引指定为正整数的向量。CategoricalPredictors包含与包含分类预测器的预测器数据列对应的索引值。如果没有预测器都是分类的,则此属性是空的([]).

联合重量

描述集合如何结合学习者预测的字符向量。

ExpandedPredictorNames

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型对分类变量使用编码,那么ExpandedPredictorNames包括描述扩展变量的名称。否则,ExpandedPredictorNames是一样的PredictorNames

FitInfo

适合信息的数字数组。的FitInfoDescription属性描述此数组的内容。

FitInfoDescription

字符向量描述的含义FitInfo数组中。

学习名

字符向量的细胞阵列,合奏中的弱学习者的名称。每个学习者的名称只出现一次。例如,如果您有100棵树的合奏,学习名{'树'}

HyperparameterOptimizationResults

超参数的交叉验证优化的描述,存储为a贝叶斯偏见对象或包含超参数和关联值的表。非空的时优化hyperParameters.名称-值对在创建时是非空的。的设置HyperparameterOptimizationOptions创建时的名称-值对:

  • “bayesopt”(默认)-类的对象贝叶斯偏见

  • “gridsearch”要么'randomsearch'- 使用的超参数表,观察到的目标函数值(交叉验证丢失),以及从最低(最佳)到最高(最差)的观察等级

方法

具有算法名称的字符向量fitrensemble用于训练集合。

ModelParameters

用于培训的参数实体

NumObservations

数字标量包含培训数据中的观察次数。

麻木

合奏中的训练学习者数量,一个正标量。

PredictorNames

预测器变量的一个小区数组,按照它们出现的顺序X

原理

描述原因的字符矢量fitrensemble停止把弱学习者加入到合奏中。

正则化

包含结果结果的结构正规化方法。使用正则化缩小以降低重新替换错误并缩小整体。

ResponseName

带有响应变量名称的字符向量Y

OrkeTransform.

用于转换分数的功能手柄,或表示内置变换函数的字符矢量。“没有”意味着没有转换;同样,“没有”意味着@ x (x)

添加或更改OrkeTransform.函数使用点表示法:

ens.ResponseTransform = @函数

训练有素的

训练有素的学习者,一个紧凑回归模型的单元阵列。

TrainedWeights

一个集合分配给它的学习者的权值的数值向量。该集成系统通过聚合来自其学习者的加权预测来计算预测响应。

W

的比例权重,一个有长度的向量n,行数X.元素的总和W1

X

训练该合奏的预测值值的矩阵或表。每列X表示一个变量,每一行表示一个观察。

Y

具有相同行数的数字列向量X这训练了整个团队。中的每个条目Y对数据的响应是否在相应的行中X

对象的功能

紧凑的 创建紧凑回归集成
crossval 交叉验证合奏
cvshrink 交叉验证萎缩(修剪)合奏
石灰 局部可解释的模型不可知解释(LIME)
损失 回归误差
partialDependence 计算部分依赖
绘图竞争依赖性 创建部分依赖图(PDP)和个人条件期望图(ICE)
预测 使用回归模型的集合来预测响应
predictorImportance 回归集合的预测因素重要性估计
正规化 寻找权重,以最小化再替换误差加上惩罚项
removeLearners 删除紧凑型回归集合的成员
resubLoss 再代换的回归误差
resubPredict 通过重新提出的集团预测响应
的简历 恢复训练合奏
沙普利 福利价值观
缩小 修剪合奏

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部折叠

加载Carsmall.数据集。考虑一种解释汽车燃料经济性的模型(MPG.),利用其重量(重量)及气缸数(气瓶).

负载Carsmall.X = [重量缸];y = mpg;

使用的方法训练增强的100个回归树集合LSBoost方法。指定气瓶是一个分类变量。

mdl = fitrensemble(x,y,'方法'“LSBoost”......“PredictorNames”,{' W ''C'},“CategoricalPredictors”, 2)
mdl =回归ensemble predictornames:{'w'c'} racatectename:'y'pationoricalpricictors:2 responsefransform:'none'numobservations:94 numtromed:100方法:'lsboost'学员名称:{'树'}原理:'通常终止完成所要求的培训周期数。'fitinfo:[100x1 double] fitinfodescription:{2x1 cell}正则化:[]属性,方法

Mdl是A.RegressionEnsemble模型对象,其中包含训练数据。

Mdl。训练有素的是存储经过训练的回归树的100 × 1细胞向量的属性(Compactregressiontree.模型对象)组成集成。

绘制第一个经过训练的回归树的图。

视图(Mdl。训练有素的{1},“模式”'图形'

Figure回归树查看器包含UIMEnu,UIControl类型的轴和其他对象。轴包含36个类型的类型线,文本。

默认情况下,fitrensemble为树木的增强集合增长浅树。

预测4,000磅4、6和8个汽缸的汽车的燃油经济性。

XNew = [4000*ones(3,1) [4;6;8]];XNew mpgNew =预测(Mdl)
mpgnew =3×119.5926 18.6388 15.4810

提示

对于回归树的集合,训练有素的属性包含的单元格向量ens.numtromed.Compactregressiontree.模型对象。用于树的文本或图形显示t在细胞载体中,输入

查看(ens.tromed {t})

扩展能力

介绍了R2011a