RegressionEnsemble

包:classreg.learning.regr
超类:CompactRegressionEnsemble

整体回归

描述

RegressionEnsemble结合了一组训练过的弱学习者模型和训练这些学习者的数据。它可以通过聚合弱学习者的预测来预测新数据的集合响应。

建设

使用创建一个回归集合对象fitrensemble．

属性

`BinEdges`	的单元格数组，用于数字预测器的二进制边p数值向量,p是预测者的数量。每个向量包含一个数值预测器的料仓边。类别预测器的单元格数组中的元素是空的，因为软件不会对类别预测器进行分类。只有指定时，软件才会回箱数值预测器`“NumBins”`使用树学习器训练模型时，将名称-值参数设置为正整数标量。的`BinEdges`属性为空，如果`“NumBins”`值为空(默认)。您可以复制被装箱的预测器数据`Xbinned`通过使用`BinEdges`训练模型的属性`mdl`． X = mdl.X;Xbinned = 0 (size(X));边缘= mdl.BinEdges;找到被装箱的预测器的索引。idxNumeric =找到(~ cellfun (@isempty边缘));if iscolumn(idxNumeric) idxNumeric = idxNumeric';end for j = idxNumeric x = x (:，j);%如果x是一个表，将x转换为数组。If istable(x) x = table2array(x);将x分组到容器中`离散化`函数。xbinned =离散化(x,[无穷;边缘{};正]);Xbinned (:, j) = Xbinned;结束 `Xbinned`包含箱子索引，范围从1到箱子的数量，用于数字预测器。`Xbinned`对于分类预测器，值为0。如果`X`包含`南`S，然后对应`Xbinned`值是`南`年代。
`CategoricalPredictors`	分类预测指标，指定为正整数的向量。`CategoricalPredictors`包含指示相应预测器是分类的索引值。索引值介于1和之间`p`,在那里`p`为用于训练模型的预测器数量。如果没有任何预测器是分类的，则此属性为空(`［］`）.
`CombineWeights`	描述集合如何结合学习者预测的字符向量。
`ExpandedPredictorNames`	扩展预测器名称，存储为字符向量的单元数组。如果模型对分类变量使用编码，则`ExpandedPredictorNames`包括描述展开变量的名称。否则,`ExpandedPredictorNames`就等于`PredictorNames`．
`FitInfo`	适合信息的数字数组。的`FitInfoDescription`属性描述此数组的内容。
`FitInfoDescription`	描述字符向量的意义`FitInfo`数组中。
`LearnerNames`	集合中带有弱学习者名称的字符向量的单元格数组。每个学习者的名字只出现一次。例如，如果你有100棵树，`LearnerNames`是`{'树'}`．
`HyperparameterOptimizationResults`	超参数的交叉验证优化描述，存储为`BayesianOptimization`对象或超参数和相关值的表。非空的时`OptimizeHyperparameters`名称-值对在创建时是非空的。属性的设置决定`HyperparameterOptimizationOptions`创建时的名称-值对: `“bayesopt”`(默认)-类的对象`BayesianOptimization` `“gridsearch”`或`“randomsearch”`-使用的超参数表，观察到的目标函数值(交叉验证损失)，以及观察值从最低(最好)到最高(最差)的排序
`方法`	具有算法名称的字符向量`fitrensemble`用于训练合奏。
`ModelParameters`	训练参数`实体`．
`NumObservations`	数字标量包含训练数据中的观察数。
`NumTrained`	集合中受过训练的学习者数量，一个正标量。
`PredictorNames`	预测器变量名称的单元数组，按它们出现的顺序排列`X`．
`ReasonForTermination`	描述原因的字符向量`fitrensemble`不再把弱学习者加入到合奏中。
`正则化`	对象的结果的结构`规范`方法。使用`正则化`与`缩小`降低再替代误差，缩小集合。
`ResponseName`	具有响应变量名称的字符向量`Y`．
`ResponseTransform`	用于转换分数的函数句柄，或表示内置转换函数的字符向量。`“没有”`意味着没有转换;同样,`“没有”`意味着`@ x (x)`．添加或更改`ResponseTransform`函数使用点表示法: ens.ResponseTransform = @函数
`训练有素的`	训练有素的学习者，一组紧凑的回归模型。
`TrainedWeights`	集合分配给学习者的权重的数字矢量。该集合通过聚合学习者的加权预测来计算预测响应。
`W`	的比例`权重`，一个具有长度的向量`n`，输入的行数`X`．元素的和`W`是`1`．
`X`	训练集合的预测值的矩阵或表。每一列的`X`表示一个变量，每一行表示一个观测值。
`Y`	具有相同行数的数字列向量`X`这训练了整个乐团。中的每个条目`Y`对数据的响应是否在对应行的`X`．

对象的功能

`紧凑的`	创建紧凑的回归集合
`crossval`	交叉验证合奏
`cvshrink`	交叉验证收缩(剪枝)集合
`石灰`	局部可解释模型不可知解释(LIME)
`损失`	回归误差
`partialDependence`	计算部分依赖
`plotPartialDependence`	创建部分依赖图(PDP)和个人条件期望图(ICE)
`预测`	预测响应使用集合的回归模型
`predictorImportance`	回归集合中预测器重要性的估计
`规范`	求权值以使再替换误差加惩罚项最小
`removeLearners`	移除紧凑回归集合的成员
`resubLoss`	再替换的回归误差
`resubPredict`	用置换法预测系综的响应
`重新开始`	恢复训练合奏
`沙普利`	沙普利值
`缩小`	修剪合奏

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象．

例子

全部折叠

火车增强回归集合

打开生活的脚本

加载carsmall数据集。考虑一个解释汽车燃油经济性的模型(英里/加仑)使用其重量(重量)和汽缸数(气缸）.

负载carsmallX =[重量气缸];Y = MPG;

训练一个增强的100个回归树集合LSBoost方法。指定气缸是一个分类变量。

Mdl = fitrensemble (X, Y,“方法”，“LSBoost”，.．.“PredictorNames”, {' W '，“C”}，“CategoricalPredictors”, 2)

Mdl = RegressionEnsemble PredictorNames: {'W' 'C'} ResponseName: 'Y' categorypredictors: 2 ResponseTransform: 'none' NumObservations: 94 numtraining: 100 Method: 'LSBoost' LearnerNames: {'Tree'} ReasonForTermination: '在完成所需的训练周期数后正常终止'。FitInfo: [100x1 double] FitInfoDescription: {2x1 cell}正则化:[]属性，方法

Mdl是一个RegressionEnsemble模型对象，其中包含训练数据等。

Mdl。训练有素的是存储训练回归树的100 × 1单元向量的属性(CompactRegressionTree模型对象)组成集合。

绘制第一个经过训练的回归树的图。

视图(Mdl。训练有素的{1}，“模式”，“图”）

图回归树查看器包含一个轴对象和其他对象的类型uimenu, uicontrol。axis对象包含36个类型为line、text的对象。

默认情况下,fitrensemble生长浅的树木增强整体的树木。

预测4、6、8缸的4000磅汽车的燃油经济性。

XNew = [4000*ones(3,1)] [4;6;8]];XNew mpgNew =预测(Mdl)

mpgNew =3×119.5926 18.6388 15.4810

提示

对于回归树的集合，则训练有素的属性包含的单元格向量ens.NumTrainedCompactRegressionTree模型对象。用于树的文字或图形显示t在单元格向量中，输入

视图(实体。训练有素的{t}）

扩展功能

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制:

的预测函数支持代码生成。金宝app
将集成预测集成到Simulink中金宝app^®，你可以使用RegressionEnsemble预测在Statistics and Machine Learning Toolbox™库或MATLAB中^®函数块预测函数。
当你训练一个团队的时候fitrensemble，回归树的代码生成限制也适用于回归树的集合。要了解更多细节，请参见代码生成的CompactRegressionTree类。