主要内容

RegressionEnsemble

包:classreg.learning.regr
超类:CompactRegressionEnsemble

描述

RegressionEnsemble结合了一组训练过的弱学习者模型和训练这些学习者的数据。它可以通过聚合弱学习者的预测来预测新数据的集合响应。

建设

使用创建一个回归集合对象fitrensemble

属性

BinEdges

的单元格数组,用于数字预测器的二进制边p数值向量,p是预测者的数量。每个向量包含一个数值预测器的料仓边。类别预测器的单元格数组中的元素是空的,因为软件不会对类别预测器进行分类。

只有指定时,软件才会回箱数值预测器“NumBins”使用树学习器训练模型时,将名称-值参数设置为正整数标量。的BinEdges属性为空,如果“NumBins”值为空(默认)。

您可以复制被装箱的预测器数据Xbinned通过使用BinEdges训练模型的属性mdl

X = mdl.X;Xbinned = 0 (size(X));边缘= mdl.BinEdges;找到被装箱的预测器的索引。idxNumeric =找到(~ cellfun (@isempty边缘));if iscolumn(idxNumeric) idxNumeric = idxNumeric';end for j = idxNumeric x = x (:,j);%如果x是一个表,将x转换为数组。If istable(x) x = table2array(x);将x分组到容器中离散化函数。xbinned =离散化(x,[无穷;边缘{};正]);Xbinned (:, j) = Xbinned;结束
Xbinned包含箱子索引,范围从1到箱子的数量,用于数字预测器。Xbinned对于分类预测器,值为0。如果X包含S,然后对应Xbinned值是年代。

CategoricalPredictors

分类预测指标,指定为正整数的向量。CategoricalPredictors包含指示相应预测器是分类的索引值。索引值介于1和之间p,在那里p为用于训练模型的预测器数量。如果没有任何预测器是分类的,则此属性为空([]).

CombineWeights

描述集合如何结合学习者预测的字符向量。

ExpandedPredictorNames

扩展预测器名称,存储为字符向量的单元数组。

如果模型对分类变量使用编码,则ExpandedPredictorNames包括描述展开变量的名称。否则,ExpandedPredictorNames就等于PredictorNames

FitInfo

适合信息的数字数组。的FitInfoDescription属性描述此数组的内容。

FitInfoDescription

描述字符向量的意义FitInfo数组中。

LearnerNames

集合中带有弱学习者名称的字符向量的单元格数组。每个学习者的名字只出现一次。例如,如果你有100棵树,LearnerNames{'树'}

HyperparameterOptimizationResults

超参数的交叉验证优化描述,存储为BayesianOptimization对象或超参数和相关值的表。非空的时OptimizeHyperparameters名称-值对在创建时是非空的。属性的设置决定HyperparameterOptimizationOptions创建时的名称-值对:

  • “bayesopt”(默认)-类的对象BayesianOptimization

  • “gridsearch”“randomsearch”-使用的超参数表,观察到的目标函数值(交叉验证损失),以及观察值从最低(最好)到最高(最差)的排序

方法

具有算法名称的字符向量fitrensemble用于训练合奏。

ModelParameters

训练参数实体

NumObservations

数字标量包含训练数据中的观察数。

NumTrained

集合中受过训练的学习者数量,一个正标量。

PredictorNames

预测器变量名称的单元数组,按它们出现的顺序排列X

ReasonForTermination

描述原因的字符向量fitrensemble不再把弱学习者加入到合奏中。

正则化

对象的结果的结构规范方法。使用正则化缩小降低再替代误差,缩小集合。

ResponseName

具有响应变量名称的字符向量Y

ResponseTransform

用于转换分数的函数句柄,或表示内置转换函数的字符向量。“没有”意味着没有转换;同样,“没有”意味着@ x (x)

添加或更改ResponseTransform函数使用点表示法:

ens.ResponseTransform = @函数

训练有素的

训练有素的学习者,一组紧凑的回归模型。

TrainedWeights

集合分配给学习者的权重的数字矢量。该集合通过聚合学习者的加权预测来计算预测响应。

W

的比例权重,一个具有长度的向量n,输入的行数X.元素的和W1

X

训练集合的预测值的矩阵或表。每一列的X表示一个变量,每一行表示一个观测值。

Y

具有相同行数的数字列向量X这训练了整个乐团。中的每个条目Y对数据的响应是否在对应行的X

对象的功能

紧凑的 创建紧凑的回归集合
crossval 交叉验证合奏
cvshrink 交叉验证收缩(剪枝)集合
石灰 局部可解释模型不可知解释(LIME)
损失 回归误差
partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望图(ICE)
预测 预测响应使用集合的回归模型
predictorImportance 回归集合中预测器重要性的估计
规范 求权值以使再替换误差加惩罚项最小
removeLearners 移除紧凑回归集合的成员
resubLoss 再替换的回归误差
resubPredict 用置换法预测系综的响应
重新开始 恢复训练合奏
沙普利 沙普利值
缩小 修剪合奏

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部折叠

加载carsmall数据集。考虑一个解释汽车燃油经济性的模型(英里/加仑)使用其重量(重量)和汽缸数(气缸).

负载carsmallX =[重量气缸];Y = MPG;

训练一个增强的100个回归树集合LSBoost方法。指定气缸是一个分类变量。

Mdl = fitrensemble (X, Y,“方法”“LSBoost”...“PredictorNames”, {' W '“C”},“CategoricalPredictors”, 2)
Mdl = RegressionEnsemble PredictorNames: {'W' 'C'} ResponseName: 'Y' categorypredictors: 2 ResponseTransform: 'none' NumObservations: 94 numtraining: 100 Method: 'LSBoost' LearnerNames: {'Tree'} ReasonForTermination: '在完成所需的训练周期数后正常终止'。FitInfo: [100x1 double] FitInfoDescription: {2x1 cell}正则化:[]属性,方法

Mdl是一个RegressionEnsemble模型对象,其中包含训练数据等。

Mdl。训练有素的是存储训练回归树的100 × 1单元向量的属性(CompactRegressionTree模型对象)组成集合。

绘制第一个经过训练的回归树的图。

视图(Mdl。训练有素的{1},“模式”“图”

图回归树查看器包含一个轴对象和其他对象的类型uimenu, uicontrol。axis对象包含36个类型为line、text的对象。

默认情况下,fitrensemble生长浅的树木增强整体的树木。

预测4、6、8缸的4000磅汽车的燃油经济性。

XNew = [4000*ones(3,1)] [4;6;8]];XNew mpgNew =预测(Mdl)
mpgNew =3×119.5926 18.6388 15.4810

提示

对于回归树的集合,则训练有素的属性包含的单元格向量ens.NumTrainedCompactRegressionTree模型对象。用于树的文字或图形显示t在单元格向量中,输入

视图(实体。训练有素的{t})

扩展功能

介绍了R2011a