fitrtree

拟合二叉决策树进行回归

折叠页面

语法

tree = fitrtree(表，ResponseVarName)

tree = fitrtree(表，公式)

tree = fittrtree (table,Y)

tree = fittrtree (X,Y)

树=树＿＿＿、名称、值)

描述

树= fitrtree (资源描述，ResponseVarName）根据表中的输入变量(也称为预测器、特征或属性)返回回归树资源描述中包含的输出(响应)资源描述。ResponseVarName。返回的树二叉树的每个分支节点是根据列的值分割的吗资源描述。

树= fitrtree (资源描述，公式）根据表中包含的输入变量返回回归树资源描述。输入公式反应的解释模型和预测变量的子集在资源描述过去适合树。

树= fitrtree (资源描述，Y）根据表中包含的输入变量返回回归树资源描述输出是向量Y。

例子

树= fitrtree (X，Y）返回基于输入变量的回归树X输出Y。返回的树二叉树的每个分支节点是根据列的值分割的吗X。

例子

树= fitrtree (＿＿＿，名称,值）除了前面语法中的任何输入参数组合之外，还使用一个或多个名称-值对参数指定选项。例如，您可以指定观察值权重或训练交叉验证的模型。

例子

全部折叠

构建回归树

打开实时脚本

加载示例数据。

负载carsmall

使用样本数据构建回归树。响应变量是每加仑英里数，即MPG。

tree = fitrtree([重量，气缸]，MPG，…“CategoricalPredictors”2,“MinParentSize”, 20岁,…“PredictorNames”, {' W '，“C”}）

tree = RegressionTree PredictorNames: {'W' 'C'} ResponseName: 'Y' CategoricalPredictors: 2 ResponseTransform: 'none' NumObservations: 94属性，方法

预测4、6、8缸4000磅重汽车的行驶里程。

MPG4Kpred = predict(tree，[4000];4000 6;4000 8])

MPG4Kpred =3×119.2778 19.2778 14.3889

控制回归树深度

打开实时脚本

fitrtree默认情况下生长深度决策树。您可以种植较浅的树以降低模型复杂性或计算时间。控件来控制树的深度“MaxNumSplits”，“MinLeafSize”,或“MinParentSize”名称-值对参数。

加载carsmall数据集。考虑位移，马力,重量作为反应的预测者英里/加仑。

负载carsmallX =[排量马力重量];

用于生长回归树的树深度控制器的默认值为:

N - 1为MaxNumSplits。n为训练样本大小。
1为MinLeafSize。
10为MinParentSize。

对于较大的训练样本量，这些默认值倾向于生长深树。

使用树深度控制的默认值训练回归树。使用10倍交叉验证对模型进行交叉验证。

rng (1);%为了重现性MdlDefault = fitrtree(X,MPG，“CrossVal”，“上”）;

画一个直方图，表示强加在树上的裂缝数量。强制分裂的次数比叶子的数量少一次。另外，查看其中一棵树。

numBranches = @(x)sum(x. isbranch);mdldefaultnumsplit = cellfun(numBranches, MdlDefault.Trained);图;直方图(mdlDefaultNumSplits)

视图(MdlDefault。训练有素的{1},“模式”，“图”）

平均分裂次数在14到15次之间。

假设您想要一个不像使用默认分割数训练的回归树那么复杂(深度)的回归树。训练另一棵回归树，但将拆分的最大数量设置为7，这大约是默认回归树拆分的平均数量的一半。使用10倍交叉验证对模型进行交叉验证。

md17 = fitrtree(X,MPG，“MaxNumSplits”7“CrossVal”，“上”）;视图(Mdl7。Trained{1},“模式”，“图”）

比较交叉验证模型的均方误差(MSEs)。

mseDefault = kfoldLoss(MdlDefault)

mseDefault = 25.7383

mse7 = kfoldLoss(md17)

Mse7 = 26.5748

Mdl7要简单得多，性能也只比MdlDefault。

优化回归树

打开实时脚本

自动优化超参数fitrtree。

加载carsmall数据集。

负载carsmall

使用重量和马力作为预测者英里/加仑。通过使用自动超参数优化，找到最小化五倍交叉验证损失的超参数。

为了再现性，设置随机种子并使用“expected-improvement-plus”采集功能。

X =[重量，马力];Y = mpg;rng默认的Mdl = fittrtree (X,Y，“OptimizeHyperparameters”，“汽车”，…“HyperparameterOptimizationOptions”结构(“AcquisitionFunctionName”，…“expected-improvement-plus”)）

|======================================================================================| | Iter | Eval |目的:| |目的BestSoFar | BestSoFar | MinLeafSize | | | |结果日志(1 +损失)运行时| | | (estim(观察) .) | | |======================================================================================| | 最好1 | | 3.2818 | 0.23977 | 3.2818 | 3.2818 | 28 |

| 2 |接收| 3.4183 | 0.06584 | 3.2818 | 3.2888 | 1 |

| |最佳| 3.1457 | 0.048394 | 3.1457 | 3.1628 | 4 |

| 4 |最佳| 2.9885 | 0.052701 | 2.9885 | 2.9885 | 9 |

| 5 |接收| 2.9978 | 0.069199 | 2.9885 | 2.9885 | 7 |

| 6 |接收| 3.0203 | 0.049133 | 2.9885 | 3.0013 | 8 |

| 7 |接收| 2.9885 | 0.05291 | 2.9885 | 2.9981 | 9 |

| 8 |最佳| 2.9589 | 0.041088 | 2.9589 | 2.9589 | 10 |

| 9 |接收| 3.078 | 0.033971 | 2.9589 | 2.9888 | 13 |

| 10 |接收| 4.1881 | 0.06277 | 2.9589 | 2.9592 | 50 |

| 11 |接收| 3.4182 | 0.056473 | 2.9589 | 2.9592 | 2 |

| 12 |接收| 3.0376 | 0.043713 | 2.9589 | 2.9591 | 6 |

| 13 |接收| 3.1453 | 0.059096 | 2.9589 | 2.9591 | 20 |

| 14 |接收| 2.9589 | 0.04608 | 2.9589 | 2.959 | 10 |

| 15 |接收| 3.0123 | 0.037637 | 2.9589 | 2.9728 | 11 |

| 16 |接收| 2.9589 | 0.049064 | 2.9589 | 2.9593 | 10 |

| 17 |接收| 3.3055 | 0.042526 | 2.9589 | 2.9593 | 3 |

| 18 |接收| 2.9589 | 0.043994 | 2.9589 | 2.9592 | 10 |

| 19 |接收| 3.4577 | 0.033968 | 2.9589 | 2.9591 | 37 |

| 20 |接收| 3.2166 | 0.045131 | 2.9589 | 2.959 | 16 |

|======================================================================================| | Iter | Eval |目的:| |目的BestSoFar | BestSoFar | MinLeafSize | | | |结果日志(1 +损失)运行时| | | (estim(观察) .) | | |======================================================================================| | 21日|接受| 3.107 | 0.04289 | 2.9589 | 2.9591 | 5 |

| 22 |接受| 3.2818 | 0.031364 | 2.9589 | 2.959 | 24 |

| 23 |接收| 3.3226 | 0.042712 | 2.9589 | 2.959 | 32 |

| 24 |接收| 4.1881 | 0.03763 | 2.9589 | 2.9589 | 43 |

| 25 |接受| 3.1789 | 0.035856 | 2.9589 | 2.9589 | 18 |

| 26 |接收| 3.0992 | 0.09437 | 2.9589 | 2.9589 | 14 |

| 27 |接收| 3.0556 | 0.061199 | 2.9589 | 2.9589 | 22 |

| 28 |接收| 3.0459 | 0.045581 | 2.9589 | 2.9589 | 12 |

| 29 |接收| 3.2818 | 0.036777 | 2.9589 | 2.9589 | 26 |

| 30 |接收| 3.4361 | 0.055666 | 2.9589 | 2.9589 | 34 |

__________________________________________________________ 优化完成。达到30分的评价。总函数评估:30总运行时间:26.7915秒总目标函数评估时间:1.6575最佳观察可行点:MinLeafSize ___________ 10目标函数观察值= 2.9589目标函数估计值= 2.9589函数评估时间= 0.041088最佳估计可行点(根据模型):MinLeafSize ___________ 10目标函数估计值= 2.9589函数评估估计时间= 0.050022

Mdl = RegressionTree responsenname: 'Y' CategoricalPredictors: [] ResponseTransform: 'none' NumObservations: 94 HyperparameterOptimizationResults: [1x1贝叶斯优化]属性，方法

无偏预测器重要性估计

打开实时脚本

加载carsmall数据集。考虑一个模型，该模型预测给定加速度、气缸数量、发动机排量、马力、制造商、型号年份和重量的汽车的平均燃油经济性。考虑气缸，制造行业,Model_Year作为分类变量。

负载carsmall柱体=分类(柱体);Mfg = categorical(cellstr(Mfg));Model_Year = categorical(Model_Year);X =表(加速度，气缸，排量，马力，制造商，…Model_Year、重量、MPG);

显示分类变量中表示的类别数量。

numCylinders = nummel (categories(Cylinders))

numCylinders = 3

numMfg = nummel (categories(Mfg))

numMfg = 28

numModelYear = nummel (categories(Model_Year))

numModelYear = 3

因为只有3个类别气缸和Model_Year，标准的CART，预测分割算法更倾向于在这两个变量上分割连续预测器。

使用整个数据集训练回归树。要生长无偏树，请指定使用曲率检验来分割预测器。因为数据中有缺失的值，所以指定使用代理分割。

Mdl = fitrtree(X，“英里”，“PredictorSelection”，“弯曲”，“代孕”，“上”）;

通过将每个预测器上的分裂导致的风险变化加起来，并将总和除以分支节点的数量，来估计预测器的重要性值。使用条形图比较估算值。

imp = predictorImportance(Mdl);图;酒吧(imp);标题(“预测重要性估计”）;ylabel (“估计”）;包含(“预测”）;H = gca;h.XTickLabel = Mdl.PredictorNames;h.XTickLabelRotation = 45;h.TickLabelInterpreter =“没有”；

在这种情况下，位移最重要的预测因素是什么马力。

在Tall数组上控制最大树深度

打开实时脚本

fitrtree默认情况下生长深度决策树。构建一个较浅的树，它需要较少的遍历高数组。使用“MaxDepth”名称-值对参数来控制最大树深度。

当您在高数组上执行计算时，MATLAB®使用并行池(如果您有并行计算工具箱™，则默认为并行池)或本地MATLAB会话。如果您希望在使用并行计算工具箱时使用本地MATLAB会话运行示例，则可以通过使用mapreduce函数。

加载carsmall数据集。考虑位移，马力,重量作为反应的预测者英里/加仑。

负载carsmallX =[排量马力重量];

转换内存中的数组X和英里/加仑到高数组。

tx = tall(X);

使用“本地”配置文件启动并行池(parpool)…连接到并行池(工人数量:6)。

ty = tall(MPG);

使用所有的观测值生长一个回归树。让树长到最大可能的深度。

为了再现性，设置使用的随机数生成器的种子rng和tallrng。结果可能因工作线程的数量和tall数组的执行环境而异。有关详情，请参阅控制代码运行的位置。

rng (“默认”) tallrng (“默认”) Mdl = fitrtree(tx,ty);

评估高表达式使用并行池“当地”:——通过1 2:在3.3秒完成,通过2 2:在1秒完成评估在6.8秒完成评估高表达式使用并行池“当地”:——通过1 6:在1.4秒完成,通过2 6:在0.41秒完成,通过3 6:在2.3秒完成,通过4 6:在3.6秒完成,通过5 6:在1.5秒完成,通过6 6:在2.9秒完成评估在14秒完成评估高表达式使用并行池“当地”:——通过1 7:在0.45秒完成,通过2 7:在0.36秒完成,通过3 7:在1.2秒完成,通过4 7:在2.5秒完成,通过5 7:在0.85秒完成,通过6 7:在1.4秒完成,通过7 7:在2.2秒完成评估在10秒完成评估高表达式使用并行池“当地”:——通过1 7:在0.45秒完成,通过2 7:在0.36秒完成,通过3 7:在1.1秒完成,通过4 7:在2.6秒完成,通过5 7:在1秒完成,通过6 7:在1.5秒完成,通过7 7:在3.2秒完成评估在12秒完成评估高表达使用并行池“当地”:——通过1 7:在0.43秒完成,通过2 7:在0.38秒完成,通过3 7:在1.6秒完成,通过4 7:在2.6秒完成,通过5 7:完成0.89秒-通过6 7:在1.2秒完成,通过7 7:在2.3秒完成评估在11秒完成评估高表达式使用并行池“当地”:——通过1 7:在0.47秒完成,通过2 7:在0.38秒完成,通过3 7:在1.1秒完成,通过4 7:在2秒完成,通过5 7:在0.76秒完成,通过6 7:在1.2秒完成,通过7 7:在2.4秒完成评估在9.5秒完成评估高表达式使用并行池“当地”:——通过1 7:在0.42秒完成,通过2 7:在0.33秒完成,通过3 7:在1.2秒完成,通过4 7:在2.2秒完成,通过5 7:在0.82秒完成,通过6 7:在1.3秒完成,通过7 7:在2.2秒完成评估在9.7秒完成评估高表达式使用并行池“当地”:——通过1 7:在0.49秒完成,通过2 7:在0.36秒完成,通过3 7:在1.1秒完成,通过4 7:在2.8秒完成,通过5 7:在1.2秒完成,通过6 7:在1.1秒完成,通过7 7:在2.3秒完成评估在10秒完成评估高表达使用并行池“当地”:——通过1 7:在0.5秒完成,通过2 7:在0.34秒完成,通过3 7:在1.1秒完成,通过4 7:在1.8秒完成,通过5 7:在0.75秒内完成-通过7中的6:在1.1秒内完成-通过7中的7:在1.8秒内完成评估在8.5秒内完成

查看训练树Mdl。

视图(Mdl,“模式”，“图”）

Mdl树有深度吗8。

估计样本内均方误差。

MSE_Mdl = collect (loss(Mdl,tx,ty))

使用并行池'local'计算tall表达式:-通过1 / 1:在3.1秒内完成评估在3.7秒内完成

MSE_Mdl = 4.9078

使用所有的观测值生长一个回归树。通过指定最大树深度来限制树深度4。

Mdl2 = fitrtree(tx,ty，“MaxDepth”4);

评估高表达式使用并行池“当地”:——通过1 2:在0.38秒完成,通过2 2:在0.35秒完成评估在1.2秒完成评估高表达式使用并行池“当地”:——通过1 7:在0.42秒完成,通过2 7:在0.35秒完成,通过3 7:在1.2秒完成,通过4 7:在1.9秒完成,通过5 7:在0.73秒完成,通过6 7:在1.2秒完成,通过7 7:在2.1秒完成评估在8.9秒完成评估高表达式使用并行池“当地”:——通过1 7:在0.44秒完成,通过2 7:在0.39秒完成,通过3 7:在1.1秒完成,通过4 7:在2.1秒完成,通过5 7:在0.74秒完成,通过6 7:在1.1秒完成,通过7 7:在2.7秒完成评估在9.7秒完成评估高表达式使用并行池“当地”:——通过1 7:在0.46秒完成,通过2 7:在0.37秒完成,通过3 7:在1.1秒完成,通过4 7:在1.9秒完成,通过5 7:在0.79秒完成,通过6 7:在1.1秒完成,通过7 7:在2.3秒完成评估在9.1秒完成评估高表达使用并行池“当地”:——通过1 7:在0.43秒完成,通过2 7:在0.41秒完成,通过3 7:在1.1秒完成,通过4 7:在1.9秒完成,通过5 7:在0.72秒内完成-通过7中的6:在1秒内完成-通过7中的7:在2.2秒内完成评估在8.9秒内完成

查看训练树Mdl2。

视图(Mdl2,“模式”，“图”）

估计样本内均方误差。

MSE_Mdl2 = collect (loss(Mdl2,tx,ty))

使用并行池'local'计算tall表达式:-通过1 / 1:在0.86秒内完成评估在1.3秒内完成

MSE_Mdl2 = 9.3903

Mdl2深度为4且样本内均方误差高于均方误差的较不复杂的树是否Mdl。

在Tall数组上优化回归树

打开实时脚本

使用tall数组自动优化回归树的超参数。样本数据集为carsmall数据集。本例将数据集转换为tall数组，并使用它来运行优化过程。

加载carsmall数据集。考虑位移，马力,重量作为反应的预测者英里/加仑。

负载carsmallX =[排量马力重量];

转换内存中的数组X和英里/加仑到高数组。

tx = tall(X);

使用“本地”配置文件启动并行池(parpool)…连接到并行池(工人数量:6)。

ty = tall(MPG);

方法自动优化超参数“OptimizeHyperparameters”名称-值对参数。找到最优“MinLeafSize”最大限度地减少保留交叉验证损失的值。(指定“汽车”使用“MinLeafSize”.）为了再现性，请使用“expected-improvement-plus”采集函数和设置种子的随机数生成器使用rng和tallrng。结果可能因工作线程的数量和tall数组的执行环境而异。有关详情，请参阅控制代码运行的位置。

rng (“默认”) tallrng (“默认”) [Mdl,FitInfo,HyperparameterOptimizationResults] = fittrtree (tx,ty，…“OptimizeHyperparameters”，“汽车”，…“HyperparameterOptimizationOptions”结构(“坚持”, 0.3,…“AcquisitionFunctionName”，“expected-improvement-plus”)）

评估高表达式使用并行池“当地”:通过1对1:在4.4秒完成评估在6.2秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.97秒完成,通过2 4:在1.6秒完成,通过3 4:在3.6秒完成,通过4 4:在2.4秒完成评估在9.8秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.55秒完成,通过2 4:完成1.3秒-通过3 4:在2.7秒完成,通过4 4:在1.9秒完成评估在7.3秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.52秒完成,通过2 4:在1.3秒完成,通过3 4:完成在3秒-通过4 4:在2秒完成评估在8.1秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.55秒完成,通过2 4:完成1.4秒-通过3 4:在2.6秒完成,通过4 4:在2秒完成评估在7.3秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.61秒完成,通过2 4:在1.2秒完成,通过3 4:在2.1秒完成,通过4 4:在1.7秒完成评估在6.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.53秒完成,通过2 4:在1.2秒内完成-通过4个中的3个:在2.4秒内完成-通过4个中的4个:在1.6秒内完成评估在6.6秒内完成使用并行池'local'评估tall表达式:-通过1个中的1个:在1.4秒内完成评估在1.7秒内完成|======================================================================================| | Iter | Eval |目的:| |目的BestSoFar | BestSoFar | MinLeafSize | | | |结果日志(1 +损失)运行时| | | (estim(观察) .) | | |======================================================================================| | 最好1 | | 3.2007 | 69.013 | 3.2007 | 3.2007 | 2 |

评估高表达式使用并行池“当地”:通过1对1:在0.52秒完成评估在0.83秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.65秒完成,通过2 4:在1.2秒完成,通过3 4:完成在3秒-通过4 4:在2秒完成评估在8.3秒完成评估高表达式使用并行池“当地”:-通过1的1:在0.79秒内完成评估在1秒内完成| |错误| NaN | 13.772 | NaN | 3.2007 | 46 |

评估高表达式使用并行池“当地”:通过1对1:在0.52秒完成评估在0.81秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.57秒完成,通过2 4:在1.3秒完成,通过3 4:在2.2秒完成,通过4 4:在1.7秒完成评估在6.6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.5秒完成,通过2 4:完成1.2秒-通过3 4:在2.7秒完成,通过4 4:在1.7秒完成评估在6.9秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.47秒完成,通过2 4:在1.1秒完成,通过3 4:在2.1秒完成,通过4 4:在1.9秒完成评估在6.4秒完成评估高表达式使用并行池“当地”:-通过1的1:0.72秒完成评估0.99秒完成最佳| 3.1876 | 29.091 | 3.1876 | 3.1884 | 18 |

评估高表达式使用并行池“当地”:通过1对1:在0.48秒完成评估在0.76秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.5秒完成,通过2 4:在1.2秒完成,通过3 4:在1.9秒完成,通过4 4:在1.4秒完成评估在5.8秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.48秒完成,通过2 4:完成1.1秒-通过3 4:完成2秒-通过4 4:在1.5秒完成评估在5.8秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.54秒完成,通过2 4:在1.1秒完成,通过3 4:在1.9秒完成,通过4 4:在1.4秒完成评估在5.7秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.46秒完成,通过2 4:在1.1秒内完成-通过3 / 4:在1.8秒内完成-通过4 / 4:在1.4秒内完成评估在5.5秒内完成评估使用并行池'local'的tall表达式:-通过1 / 1:在0.64秒内完成评估在0.92秒内完成| 4 |最佳| 2.9048 | 33.465 | 2.9048 | 2.9537 | 6 |

评估高表达式使用并行池“当地”:通过1对1:在0.44秒完成评估在0.71秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.46秒完成,通过2 4:在1.1秒完成,通过3 4:完成2秒-通过4 4:在1.5秒完成评估在5.9秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.47秒完成,通过2 4:完成1.1秒-通过3 4:在1.9秒完成,通过4 4:在1.5秒完成评估在5.7秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒完成,通过3 4:在1.9秒完成,通过4 4:在1.4秒完成评估在5.6秒完成评估高表达式使用并行池“当地”:-通过1的1:在0.66秒内完成评估在0.92秒内完成| 5 |接受| 3.2895 | 25.902 | 2.9048 | 2.9048 | 15 |

评估高表达式使用并行池“当地”:通过1对1:在0.54秒完成评估在0.82秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.53秒完成,通过2 4:在1.2秒完成,通过3 4:完成2秒-通过4 4:在1.5秒完成评估在6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.5秒完成,通过2 4:完成1.1秒-通过3 4:在2.1秒完成,通过4 4:在1.9秒完成评估在6.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.49秒完成,通过2 4:在1.1秒完成,通过3 4:在1.9秒完成,通过4 4:在2秒完成评估在6.6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1.1秒内完成-通过4次中的3次:在2秒内完成-通过4次中的4次:在1.4秒内完成评估在5.8秒内完成使用并行池'local'评估tall表达式:-通过1次中的1次:在0.68秒内完成评估在0.99秒内完成|0 |接受| 3.1641 | 35.522 | 2.9048 | 3.1493 | |

评估高表达式使用并行池“当地”:通过1对1:在0.51秒完成评估在0.79秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.67秒完成,通过2 4:在1.3秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在6.2秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:完成1.1秒-通过3 4:在1.9秒完成,通过4 4:在1.4秒完成评估在5.7秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.48秒完成,通过2 4:在1.4秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.8秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.46秒完成,通过2 4:在1.1秒内完成-通过3 / 4:在1.8秒内完成-通过4 / 4:在1.4秒内完成评估在5.6秒内完成使用并行池'local'评估tall表达式:-通过1 / 1:在0.63秒内完成评估在0.89秒内完成|0 |接受| 2.9048 | 33.755 | 2.9048 | 2.9048 | 6 |

评估高表达式使用并行池“当地”:通过1对1:在0.45秒完成评估在0.75秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.51秒完成,通过2 4:在1.2秒完成,通过3 4:在2.2秒完成,通过4 4:在1.5秒完成评估在6.1秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.49秒完成,通过2 4:完成1.1秒-通过3 4:在1.9秒完成,通过4 4:在1.4秒完成评估在5.6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.46秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1.1秒内完成-通过4次中的3次:在1.8秒内完成-通过4次中的4次:在1.3秒内完成评估在5.4秒内完成使用并行池'local'评估tall表达式:-通过1次中的1次:在0.68秒内完成评估在0.97秒内完成bbb80 |接受| 2.9522 | 33.362 | 2.9048 | 2.9048 | 7 |

评估高表达式使用并行池“当地”:通过1对1:在0.42秒完成评估在0.71秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.48秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.5秒完成,通过2 4:在1.1秒完成,通过3 4:在1.9秒完成,通过4 4:在1.5秒完成评估在5.7秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.49秒完成,通过2 4:在1.1秒内完成-通过4次中的3次:在1.8秒内完成-通过4次中的4次:在1.4秒内完成评估在5.5秒内完成使用并行池'local'评估tall表达式:-通过1次中的1次:在0.64秒内完成评估在0.9秒内完成bbb90 |接受| 2.9985 | 32.674 | 2.9048 | 2.9048 | 8 |

评估高表达式使用并行池“当地”:通过1对1:在0.43秒完成评估在0.7秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.47秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.56秒完成,通过2 4:完成1.2秒-通过3 4:完成2秒-通过4 4:在1.4秒完成评估在6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.5秒完成评估在5.7秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.47秒完成,通过2 4:在1.1秒内完成-通过4次中的3次:在1.8秒内完成-通过4次中的4次:在1.6秒内完成评估在5.8秒内完成使用并行池'local'评估tall表达式:-通过1次中的1次:在0.88秒内完成评估在1.2秒内完成| 10 |接受| 3.0185 | 33.922 | 2.9048 | 2.9048 | 10 |

评估高表达式使用并行池“当地”:通过1对1:在0.44秒完成评估在0.74秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.46秒完成,通过2 4:在1.2秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.48秒完成,通过2 4:完成1.2秒-通过3 4:完成2秒-通过4 4:在1.6秒完成评估在6.2秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.73秒完成,通过2 4:在1.2秒完成,通过3 4:完成2秒-通过4 4:在1.5秒完成评估在6.2秒完成评估高表达式使用并行池“当地”:-通过1的1:在0.63秒内完成评估在0.88秒内完成| 11 |接受| 3.2895 | 26.625 | 2.9048 | 2.9048 | 14 |

评估高表达式使用并行池“当地”:通过1对1:在0.48秒完成评估在0.78秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.51秒完成,通过2 4:在1.2秒完成,通过3 4:在1.9秒完成,通过4 4:在1.3秒完成评估在5.7秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.48秒完成,通过2 4:在1.2秒内完成-通过4次中的3次:在1.8秒内完成-通过4次中的4次:在1.4秒内完成评估在5.5秒内完成使用并行池'local'评估tall表达式:-通过1次中的1次:在0.65秒内完成评估在0.9秒内完成| 12 |接受| 3.4798 | 18.111 | 2.9048 | 2.9049 | 31 |

评估高表达式使用并行池“当地”:通过1对1:在0.44秒完成评估在0.71秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.5秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.5秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.48秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.7秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.43秒完成,通过2 4:在1.2秒内完成-通过4中的3:在2秒内完成-通过4中的4:在1.4秒内完成评估在5.7秒内完成使用并行池'local'评估tall表达式:-通过1中的1:在0.64秒内完成评估在0.91秒内完成| 13 |接受| 3.2248 | 47.436 | 2.9048 | 2.9048 | 1 |

评估高表达式使用并行池“当地”:通过1对1:在0.46秒完成评估在0.74秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.6秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.57秒完成,通过2 4:在1.1秒完成,通过3 4:在2.6秒完成,通过4 4:在1.6秒完成评估在6.6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.62秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.7秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.5秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.6秒完成评估在6.1秒完成评估高表达式使用并行池“当地”:-通过1的1:在0.61秒内完成评估在0.88秒内完成| 14 |接受| 3.1498 | 42.062 | 2.9048 | 2.9048 | 3 |

评估高表达式使用并行池“当地”:通过1对1:在0.46秒完成评估在0.76秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.48秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.5秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.67秒完成,通过2 4:在1.3秒完成,通过3 4:在2.3秒完成,通过4 4:在2.2秒完成评估在7.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1.1秒内完成-通过4中的3:在1.8秒内完成-通过4中的4:在1.4秒内完成评估在5.4秒内完成使用并行池'local'评估tall表达式:-通过1中的1:在0.6秒内完成评估在0.86秒内完成| 15 |接受| 2.9048 | 34.3 | 2.9048 | 2.9048 | 6 |

评估高表达式使用并行池“当地”:通过1对1:在0.48秒完成评估在0.78秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:完成1.2秒-通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.43秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒内完成-通过4中的3:在2秒内完成-通过4中的4:在1.4秒内完成评估在5.7秒内完成使用并行池'local'评估tall表达式:-通过1中的1:在0.62秒内完成评估在0.88秒内完成| 16 |接受| 2.9048 | 32.97 | 2.9048 | 2.9048 | 6 |

评估高表达式使用并行池“当地”:通过1对1:在0.43秒完成评估在0.73秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.47秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.43秒完成,通过2 4:在1.1秒内完成-通过4次中的3次:在1.8秒内完成-通过4次中的4次:在1.3秒内完成评估在5.5秒内完成使用并行池'local'评估tall表达式:-通过1次中的1次:在0.62秒内完成评估在0.9秒内完成| 17 |接受| 3.1847 | 17.47 | 2.9048 | 2.9048 | 23 |

评估高表达式使用并行池“当地”:通过1对1:在0.43秒完成评估在0.72秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.7秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.68秒完成,通过2 4:完成1.4秒-通过3 4:在1.9秒完成,通过4 4:在1.4秒完成评估在6.3秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒内完成-通过4中的3:在1.8秒内完成-通过4中的4:在1.4秒内完成评估在5.4秒内完成使用并行池'local'评估tall表达式:-通过1中的1:在0.62秒内完成评估在0.93秒内完成| 18 |接受| 3.1817 | 33.346 | 2.9048 | 2.9048 | 4 |

评估高表达式使用并行池“当地”:通过1对1:在0.43秒完成评估在0.72秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:-通过1的1:在0.62秒内完成评估在0.86秒内完成| 19 |错误| NaN | 10.235 | 2.9048 | 2.9048 | 38 |

评估高表达式使用并行池“当地”:通过1对1:在0.47秒完成评估在0.76秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.2秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒完成,通过3 4:在1.9秒完成,通过4 4:在1.3秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.43秒完成,通过2 4:在1.1秒内完成-通过4中的3:在1.8秒内完成-通过4中的4:在1.4秒内完成评估在5.5秒内完成使用并行池'local'评估tall表达式:-通过1中的1:在0.63秒内完成评估在0.89秒内完成| 20 |接受| 3.0628 | 32.459 | 2.9048 | 2.9048 | 12 |

评估高表达式使用并行池“当地”:通过1对1:在0.46秒完成评估在0.76秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.48秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.68秒完成,通过2 4:在1.7秒内完成-通过4个中的3个:在2.1秒内完成-通过4个中的4个:在1.4秒内完成评估在6.8秒内完成使用并行池'local'评估tall表达式:-通过1个中的1个:在0.64秒内完成评估在0.9秒内完成|======================================================================================| | Iter | Eval |目的:| |目的BestSoFar | BestSoFar | MinLeafSize | | | |结果日志(1 +损失)运行时| | | (estim(观察) .) | | |======================================================================================| | 21日|接受| 3.1847 | 19.02 | 2.9048 | 2.9048 | | 27岁

评估高表达式使用并行池“当地”:通过1对1:在0.45秒完成评估在0.75秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.47秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.6秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.5秒完成,通过2 4:在1.6秒完成,通过3 4:在2.4秒完成,通过4 4:在1.5秒完成评估在6.8秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒内完成-通过3 / 4:在1.8秒内完成-通过4 / 4:在1.5秒内完成评估在5.6秒内完成使用并行池'local'评估tall表达式:-通过1 / 1:在0.63秒内完成评估在0.89秒内完成| 22 |接受| 3.0185 | 33.933 | 2.9048 | 2.9048 | 9 |

评估高表达式使用并行池“当地”:通过1对1:在0.46秒完成评估在0.76秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.43秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:-通过1的1:在0.64秒内完成评估在0.89秒内完成| 23 |接受| 3.0749 | 25.147 | 2.9048 | 2.9048 | 20 |

评估高表达式使用并行池“当地”:通过1对1:在0.44秒完成评估在0.73秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.42秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.43秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.53秒完成,通过2 4:在1.4秒完成,通过3 4:在1.9秒完成,通过4 4:在1.4秒完成评估在5.9秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒内完成-通过3 / 4:在1.8秒内完成-通过4 / 4:在1.4秒内完成评估在5.5秒内完成使用并行池'local'评估tall表达式:-通过1 / 1:在0.62秒内完成评估在0.88秒内完成| 24 |接受| 3.0628 | 32.764 | 2.9048 | 2.9048 | 11 |

评估高表达式使用并行池“当地”:通过1对1:在0.44秒完成评估在0.73秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.2秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:-通过1的1:在0.61秒内完成评估在0.87秒内完成| 25 |错误| NaN | 10.294 | 2.9048 | 2.9048 | 34 |

评估高表达式使用并行池“当地”:通过1对1:在0.44秒完成评估在0.73秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.43秒完成,通过2 4:在1.1秒内完成-通过4次中的3次:在1.8秒内完成-通过4次中的4次:在1.3秒内完成评估在5.4秒内完成使用并行池'local'评估tall表达式:-通过1次中的1次:在0.62秒内完成评估在0.87秒内完成| 26 |接受| 3.1847 | 17.587 | 2.9048 | 2.9048 | 25 |

评估高表达式使用并行池“当地”:通过1对1:在0.45秒完成评估在0.73秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.43秒完成,通过2 4:在1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.3秒完成评估高表达式使用并行池“当地”:-通过1的1:在0.66秒内完成评估在0.96秒内完成| 27 |接受| 3.2895 | 24.867 | 2.9048 | 2.9048 | 16 |

评估高表达式使用并行池“当地”:通过1对1:在0.44秒完成评估在0.74秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.43秒完成,通过2 4:完成1.1秒-通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.5秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.4秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:-通过1的1:在0.6秒内完成评估在0.88秒内完成| 28 |接受| 3.2135 | 24.928 | 2.9048 | 2.9048 | 13 |

评估高表达式使用并行池“当地”:通过1对1:在0.47秒完成评估在0.76秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.45秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.46秒完成,通过2 4:在1.1秒内完成-通过4次中的3次:在1.8秒内完成-通过4次中的4次:在1.3秒内完成评估在5.5秒内完成使用并行池'local'评估tall表达式:-通过1次中的1次:在0.62秒内完成评估在0.87秒内完成| 29 |接受| 3.1847 | 17.582 | 2.9048 | 2.9048 | 21 |

评估高表达式使用并行池“当地”:通过1对1:在0.53秒完成评估在0.81秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.44秒完成,通过2 4:在1.1秒完成,通过3 4:在1.8秒完成,通过4 4:在1.3秒完成评估在5.4秒完成评估高表达式使用并行池“当地”:——通过1 4:在0.43秒完成,通过2 4:在1.1秒内完成-通过4中的3:在1.8秒内完成-通过4中的4:在1.3秒内完成评估在5.4秒内完成使用并行池'local'评估tall表达式:-通过1中的1:在0.63秒内完成评估在0.88秒内完成| 30 |接受| 3.1827 | 17.597 | 2.9048 | 2.9122 | 29 |

__________________________________________________________ 优化完成。达到30分的评价。总函数求值:30总运行时间:882.5668秒。总目标函数评价时间:859.2122最佳观测可行点:MinLeafSize ___________ 6观测目标函数值= 2.9048估计目标函数值= 2.9122函数评价时间= 33.4655最佳估计可行点(根据模型):MinLeafSize ___________ 6估计目标函数值= 2.9122估计函数评价时间= 33.6594使用并行池“local”评价tall表达式:-通过2中的1:在0.26秒完成,通过2 2:在0.26秒完成评估在0.84秒完成评估高表达使用并行池“当地”:——通过1 7:在0.31秒完成,通过2 7:在0.25秒完成,通过3 7:在0.75秒完成,通过4 7:在1.2秒完成,通过5 7:在0.45秒完成,通过6 7:在0.69秒完成,通过7 7:在1.2秒完成评估在5.7秒完成评估高表达式使用并行池“当地”:——通过1 7:在0.28秒完成,通过2 7:在0.24秒完成,通过3 7:在0.75秒完成,通过4 7:在1.2秒完成,通过5 7:在0.46秒完成,通过6 7:在0.67秒完成,通过7 7:在1.2秒完成评估在5.6秒完成评估高表达式使用并行池“当地”:——通过1 7:在0.32秒完成,通过2 7:在0.25秒完成,通过3 7:在0.71秒完成,通过4 7:在1.2秒完成,通过5 7:在0.47秒完成,通过6 7:在0.66秒完成,通过7 7:在1.2秒完成评估在5.6秒完成评估高表达使用并行池“当地”:——通过1 7:在0.29秒完成,通过2 7:在0.25秒完成,通过3 7:在0.73秒完成,通过4 7:在1.2秒完成,通过5 7:在0.46秒完成,通过6 7:在0.68秒完成,通过7 7:在1.2秒完成评估在5.5秒完成评估高表达使用并行池“当地”:——通过1 7:在0.27秒完成,通过2 7:在0.25秒完成,通过3 7:在0.75秒完成,通过4 7:在1.2秒完成,通过5 7:在0.47秒完成,通过6 7:在0.69秒完成,通过7 7:在1.2秒完成评估在5.6秒完成

Mdl = CompactRegressionTree ResponseName: 'Y' CategoricalPredictors: [] ResponseTransform: 'none'属性，方法

FitInfo =结构，没有字段。

HyperparameterOptimizationResults = bayesanoptimization with properties: ObjectiveFcn: @createObjFcn/tallObjFcn变量描述:[3×1 optimizableVariable]选项:[1×1 struct] MinObjective: 2.9048 XAtMinObjective: [1×1 table] minestimatedobjobjective: 2.9122 xatminestimatedobjobjective: [1×1 table] NumObjectiveEvaluations: 30 TotalElapsedTime: 882.5668 NextPoint: [1×1 table] XTrace: [30×1 table] ObjectiveTrace: [30×1 double] ConstraintsTrace: [] UserDataTrace:{30×1细胞}ObjectiveEvaluationTimeTrace:[30×1双]IterationTimeTrace:[30×1双]ErrorTrace:[30×1双]FeasibilityTrace:[30×1逻辑]FeasibilityProbabilityTrace:[30×1双]IndexOfMinimumTrace:[30×1双]ObjectiveMinimumTrace:[30×1双]EstimatedObjectiveMinimumTrace:[30×1双)

输入参数

全部折叠

`资源描述`- - - - - -样本数据
表格

用于训练模型的样本数据，指定为表。每一行资源描述对应一个观测值，每一列对应一个预测变量。可选地,资源描述可以包含一个用于响应变量的附加列。除了字符向量的单元格数组之外，不允许使用多列变量和单元格数组。

如果资源描述包含响应变量，并且您希望使用中的所有剩余变量资源描述作为预测器，然后通过使用指定响应变量ResponseVarName。

如果资源描述包含响应变量，并且您希望仅使用中剩余变量的子集资源描述作为预测器，然后通过使用指定公式公式。

如果资源描述不包含响应变量，则使用Y。中的行数和响应变量的长度资源描述必须是相等的。

数据类型:表格

`ResponseVarName`- - - - - -响应变量名称
中的变量名称`资源描述`

响应变量名，指定为中的变量名资源描述。响应变量必须是一个数值向量。

你必须说明ResponseVarName作为字符向量或字符串标量。例如，如果资源描述存储响应变量Y作为资源描述。Y，然后指定为“Y”。否则，软件处理的所有列资源描述,包括Y，作为模型训练时的预测因子。

数据类型:字符|字符串

`公式`- - - - - -反应变量和预测变量子集的解释模型
特征向量|字符串标量

响应变量的解释模型和预测变量的子集，以字符向量或字符串标量的形式指定“Y ~ X1 + X2 + X3”。在这个形式中，Y表示响应变量，和X1，X2,X3表示预测变量。

中的变量子集资源描述作为训练模型的预测器，请使用公式。如果你指定一个公式，那么软件不使用任何变量资源描述那就不要出现在公式。

公式中的变量名必须是资源描述（Tbl.Properties.VariableNames)和有效的MATLAB^®标识符。

中的变量名进行验证资源描述通过使用isvarname函数。下面的代码返回逻辑1（真正的)，以获取每个具有有效变量名的变量。

cellfun (@isvarname Tbl.Properties.VariableNames)

如果变量名在资源描述无效，然后使用matlab.lang.makeValidName函数。

table . properties . variablenames = matlab.lang.makeValidName(table . properties . variablenames);

数据类型:字符|字符串

`Y`- - - - - -响应数据
数值列向量

响应数据，指定为具有相同行数的数字列向量X。每一项Y响应的数据是否在对应的行中X。

该软件考虑南值Y是缺失的值。fitrtree不使用缺失值的观测值Y在合适的时候。

数据类型:单|双

`X`- - - - - -预测数据
数字矩阵

预测器数据，指定为数字矩阵。的每一列X表示一个变量，每行表示一个观测值。

fitrtree认为南值X作为缺失的值。fitrtree不使用所有缺失值的观测值X在合适的时候。fitrtree使用有缺失值的观测值X找到这些观测值具有有效值的变量的分裂。

数据类型:单|双

名称-值对参数

指定可选的逗号分隔对名称,值参数。名字是参数名和吗价值是对应的值。名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数，如Name1, Value1,…,的家。

例子:“CrossVal”,“上”、“MinParentSize”,30岁指定一个交叉验证的回归树，每个分支节点至少有30个观测值。

请注意

方法之外不能使用任何交叉验证名称-值对参数“OptimizeHyperparameters”名称-值对参数。您可以修改的交叉验证“OptimizeHyperparameters”只有使用“HyperparameterOptimizationOptions”名称-值对参数。

模型参数

全部折叠

`“CategoricalPredictors”`- - - - - -分类预测表
正整数向量|逻辑向量|字符矩阵|字符串数组|字符向量的单元数组|`“所有”`

分类预测符列表，指定为由逗号分隔的对“CategoricalPredictors”这张表中的一个值。

价值	描述
正整数向量	向量中的每个条目都是一个索引值，对应于预测器数据(`X`或`资源描述`)，其中包含一个分类变量。
逻辑向量	一个`真正的`条目意味着预测器数据的对应列(`X`或`资源描述`)是一个分类变量。
字符矩阵	矩阵的每一行都是一个预测变量的名称。名称必须与中的条目匹配`PredictorNames`。用额外的空格填充名称，使字符矩阵的每一行具有相同的长度。
字符向量的字符串数组或单元数组	数组中的每个元素都是一个预测变量的名称。名称必须与中的条目匹配`PredictorNames`。
`“所有”`	所有的预测都是绝对的。

默认情况下，如果预测器数据在表中(资源描述)，fitrtree如果变量是逻辑向量、无序分类向量、字符数组、字符串数组或字符向量的单元数组，则假定它是分类的。如果预测数据是一个矩阵(X)，fitrtree假设所有预测因子都是连续的。要将任何其他预测符标识为分类预测符，请使用“CategoricalPredictors”名称-值对参数。

例子:“CategoricalPredictors”、“所有”

数据类型:单|双|逻辑|字符|字符串|细胞

`“MaxDepth”`- - - - - -最大树深
正整数

最大树深度，指定为由逗号分隔的对“MaxDepth”一个正整数。为此参数指定一个值，以返回具有更少级别的树，并且需要更少的遍历tall数组来计算。的算法fitrtree对数据进行一次传递，并对每个树级别进行额外的传递。缺省情况下，该函数不设置树的最大深度。

请注意

此选项仅在使用时适用fitrtree在高数组上。看到高大的数组了解更多信息。

`“MergeLeaves”`- - - - - -叶合并标志
`“上”`(默认)|`“关闭”`

叶子合并标志，指定为由逗号分隔的对“MergeLeaves”和“上”或“关闭”。

如果MergeLeaves是“上”,然后fitrtree：

合并来自同一父节点的叶子，并产生大于或等于与父节点关联的风险值的总和
估计剪枝子树的最优序列，但不剪枝回归树

否则,fitrtree不合并叶子。

例子:“MergeLeaves”,“关闭”

`“MinParentSize”`- - - - - -最小分支节点观测数
`10`(默认)|正整数值

分支节点观测的最小数量，指定为由逗号分隔的对组成“MinParentSize”一个正整数。树中的每个分支节点至少有MinParentSize观察。如果两者都有MinParentSize和MinLeafSize，fitrtree使用更大叶子的设置:MinParentSize = max(MinParentSize,2*MinLeafSize)。

例子:“MinParentSize”,8

数据类型:单|双

`“NumBins”`- - - - - -数字预测器的箱数
`［］`(空的)(默认)|正整数标量

用于数字预测符的箱子数，指定为由“NumBins”一个正整数标量。

如果“NumBins”值为空(默认)，则软件不存储任何预测器。
如果您指定“NumBins”值为正整数标量，则软件将每个数字预测器放入指定数量的等概率bins中，然后在bin索引上生长树而不是原始数据。
- 如果“NumBins”值超过数(u)的唯一值作为预测器，那么fitrtree将预测器放入u箱里。
- fitrtree不支持分类预测。

当您使用大型训练数据集时，这种分箱选项可以加快训练速度，但可能会降低准确性。你可以试试“NumBins”,50岁先换，再换“NumBins”价值取决于准确性和训练速度。

训练后的模型将箱子边缘存储在BinEdges财产。

例子:“NumBins”,50岁

数据类型:单|双

`“PredictorNames”`- - - - - -预测变量名称
唯一名称的字符串数组|唯一字符向量的单元数组

预测变量名，指定为由“PredictorNames”和唯一名称的字符串数组或唯一字符向量的单元格数组。的功能“PredictorNames”这取决于你提供训练数据的方式。

如果你提供X和Y，那么你可以使用“PredictorNames”中的预测变量指定名称X。
- 名字的顺序PredictorNames必须对应于的列顺序X。也就是说,PredictorNames {1}是…的名字X (: 1)，PredictorNames {2}是…的名字X (:, 2)等等。同时,大小(X, 2)和元素个数(PredictorNames)必须是相等的。
- 默认情况下,PredictorNames是{x1, x2,…}。
如果你提供资源描述，那么你可以使用“PredictorNames”选择在训练中使用哪些预测变量。也就是说,fitrtree中只使用预测变量PredictorNames以及训练时的反应变量。
- PredictorNames一定是的子集Tbl.Properties.VariableNames并且不能包含响应变量的名称。
- 默认情况下,PredictorNames包含所有预测变量的名称。
- 一个好的实践是使用其中一种来指定训练的预测器“PredictorNames”或公式，但不是两者都有。

例子:PredictorNames,{‘SepalLength’,‘SepalWidth’,‘PetalLength’,‘PetalWidth}

数据类型:字符串|细胞

`“PredictorSelection”`- - - - - -用于选择最佳分割预测器的算法
`“allsplits”`(默认)|`“弯曲”`|`“interaction-curvature”`

用于在每个节点上选择最佳分割预测器的算法，指定为由逗号分隔的对“PredictorSelection”和这个表中的一个值。

价值	描述
`“allsplits”`	标准CART -选择在所有预测器的所有可能分割上最大化分割标准增益的分割预测器[1]。
`“弯曲”`	弯曲测试-选择分割预测器，最小化p每个预测因子与响应之间的独立性的卡方检验的-值[2]。训练速度与标准CART相似。
`“interaction-curvature”`	交互测试-选择分割预测器，最小化p-值的卡方检验每个预测器和响应之间的独立性(即进行曲率检验)，并且最小化p-每对预测因子与反应之间的独立性的卡方检验的值[2]。训练速度可以比标准CART慢。

为“弯曲”和“interaction-curvature”，如果所有测试都成功的话p-值大于0.05fitrtree停止分裂节点。

提示

标准CART倾向于选择包含许多不同值的分割预测因子，例如连续变量，而不是包含很少不同值的分割预测因子，例如分类变量［3］。如果下列任何一项为真，请考虑指定曲率或相互作用测试:
- 如果存在比其他预测器具有相对较少的不同值的预测器，例如，如果预测器数据集是异构的。
- 如果分析预测因子的重要性是你的目标。有关预测器重要性估计的更多信息，请参见predictorImportance和特征选择简介。
使用标准CART种植的树木对预测变量的相互作用不敏感。此外，与交互测试的应用相比，这样的树不太可能在许多不相关的预测因素中识别出重要的变量。因此，要考虑预测因子的相互作用，并在许多不相关变量的存在下识别重要变量，请指定相互作用测试。
的值不影响预测速度“PredictorSelection”。

欲知详情fitrtree选择分割预测符，参见节点拆分规则和选择分割预测器选择技术。

例子:“PredictorSelection”、“弯曲”

`“删除”`- - - - - -估计最优修剪子树序列的标志
`“上”`(默认)|`“关闭”`

标记，用于估计被修剪的子树的最优序列，指定为由逗号分隔的对组成“删除”和“上”或“关闭”。

如果修剪是“上”,然后fitrtree生长回归树并估计被修剪的子树的最优序列，但不修剪回归树。否则,fitrtree生长回归树而不估计修剪子树的最优序列。

要修剪经过训练的回归树，将回归树传递给修剪。

例子:“删除”,“关闭”

`“PruneCriterion”`- - - - - -修剪的标准
`mse的`(默认)

修剪标准，指定为由逗号分隔的对“PruneCriterion”和mse的。

`“QuadraticErrorTolerance”`- - - - - -二次误差容限
`1 e-6`(默认)|正标量值

每个节点的二次误差容忍度，指定为由逗号分隔的对组成“QuadraticErrorTolerance”一个正的标量值。当每个节点的加权均方误差降至以下时，函数停止分裂节点QuadraticErrorTolerance *ε,在那里ε是所有的加权均方误差吗n在生长决策树之前计算的响应。

$ε ＝ \sum_{我＝ 1}^{n} w_{我} {（ y_{我} - \bar{y} ）}^{2} 。$

w_我是观察的权重吗我，假设所有观测值的权重之和为1 ( $\sum_{我＝ 1}^{n} w_{我} ＝ 1$ ),

$\bar{y} ＝ \sum_{我＝ 1}^{n} w_{我} y_{我}$

是所有回答的加权平均值。

有关节点拆分的详细信息，请参见节点拆分规则。

例子:“QuadraticErrorTolerance”,1的军医

`“复制”`- - - - - -标志来强制再现性
`假`(逻辑`0`）(默认)|`真正的`(逻辑`1`）

标志，用于在训练模型的重复运行中强制再现性，指定为由逗号分隔的对“复制”,要么假或真正的。

如果“NumVariablesToSample”不是“所有”，然后软件随机为每个分裂选择预测因子。要再现随机选择，必须指定“重现”,真的并使用设置随机数生成器的种子rng。注意这个设置“复制”来真正的可以减缓训练。

例子:“重现”,真的

数据类型:逻辑

`“ResponseName”`- - - - - -响应变量名称
`“Y”`(默认)|特征向量|字符串标量

响应变量名，指定为由“ResponseName”以及字符向量或字符串标量。

如果你提供Y，那么你可以使用“ResponseName”为响应变量指定一个名称。
如果你提供ResponseVarName或公式，那么你就不能使用“ResponseName”。

例子:“ResponseName”、“响应”

数据类型:字符|字符串

`“ResponseTransform”`- - - - - -响应转换
`“没有”`(默认)|函数处理

响应转换，指定为由逗号分隔的对组成“ResponseTransform”,要么“没有”或者函数句柄。默认值为“没有”，这意味着@ (y) y，或者没有变换。对于MATLAB函数或您定义的函数，使用其函数句柄。函数句柄必须接受一个向量(原始响应值)并返回一个大小相同的向量(转换后的响应值)。

例子:假设您创建了一个函数句柄，通过使用对输入向量应用指数变换Myfunction = @(y)exp(y)。然后，您可以将响应转换指定为myfunction ResponseTransform,。

数据类型:字符|字符串|function_handle

`“SplitCriterion”`- - - - - -划分的标准
`MSE的`(默认)

分隔条件，指定为由逗号分隔的对“SplitCriterion”和MSE的，即均方误差。

例子:“SplitCriterion”、“MSE的

`“代孕”`- - - - - -代理决策分割标志
`“关闭”`(默认)|`“上”`|`“所有”`|正整数

代理决策拆分标志，指定为由逗号分隔的对“代孕”和“上”，“关闭”，“所有”，或者一个正整数。

当“上”，fitrtree在每个分支节点上最多查找10个代理拆分。
当设为正整数时，fitrtree在每个分支节点上最多查找指定数量的代理分割。
当设置为“所有”，fitrtree查找每个分支节点上的所有代理分割。的“所有”设置会占用大量的时间和内存。

使用代理分割来提高对缺失值数据的预测的准确性。该设置还使您能够计算预测器之间预测关联的度量。

例子:“代孕”,“上”

数据类型:单|双|字符|字符串

`“重量”`- - - - - -观察权重
`(大小(X, 1), 1)`(默认)|标量值向量|中的变量名称`资源描述`

观察值权重，指定为由逗号分隔的对“重量”一个标量值的向量或者一个变量的名字资源描述。软件对每一行的观察值进行加权X或资源描述中对应的值权重。的大小权重必须等于里面的行数X或资源描述。

如果将输入数据指定为表资源描述,然后权重可以是变量的名称资源描述它包含一个数值向量。在这种情况下，您必须指定权重作为字符向量或字符串标量。例如，如果权重向量W存储为资源描述。W，然后指定为' W '。否则，软件处理的所有列资源描述,包括W，作为模型训练时的预测因子。

fitrtree的值进行规范化权重和为1。

数据类型:单|双|字符|字符串

交叉验证

全部折叠

`“CrossVal”`- - - - - -交叉验证标志
`“关闭”`(默认)|`“上”`

交叉验证标志，指定为包含的逗号分隔对“CrossVal”,要么“上”或“关闭”。

如果“上”，fitrtree生长一个交叉验证的决策树10倍。控件之一可以覆盖此交叉验证设置“KFold”，“坚持”，“Leaveout”,或“CVPartition”名称-值对参数。您只能使用以下四个选项中的一个(“KFold”，“坚持”，“Leaveout”,或“CVPartition”)，在创建交叉验证树时执行。

另外,旨在树稍后使用crossval方法。

例子:“CrossVal”,“上”

`“CVPartition”`- - - - - -交叉验证树的分区
`cvpartition`对象

交叉验证树的分区，指定为由逗号分隔的对组成“CVPartition”创建的对象cvpartition。

如果你使用“CVPartition”，你不能使用“KFold”，“坚持”,或“Leaveout”名称-值对参数。

`“坚持”`- - - - - -保留验证的数据部分
`0`(默认)|范围内的标量值`[0, 1]`

用于保留验证的数据部分，指定为由逗号分隔的对组成“坚持”和值域内的标量值[0, 1]。保留验证测试数据的指定部分，并使用其余数据进行训练。

如果你使用“坚持”，你不能使用“CVPartition”，“KFold”,或“Leaveout”名称-值对参数。

例子:“坚持”,0.1

数据类型:单|双

`“KFold”`- - - - - -折叠数
`10`(默认)|大于1的正整数

在交叉验证树中使用的折叠数，指定为由逗号分隔的对“KFold”一个大于1的正整数。

如果你使用“KFold”，你不能使用“CVPartition”，“坚持”,或“Leaveout”名称-值对参数。

例子:“KFold”,8

数据类型:单|双

`“Leaveout”`- - - - - -留一个交叉验证标志
`“关闭”`(默认)|`“上”`

留一个交叉验证标志，指定为由逗号分隔的对“Leaveout”,要么“上”或的假。通过设置为来使用留一交叉验证“上”。

如果你使用“Leaveout”，你不能使用“CVPartition”，“坚持”,或“KFold”名称-值对参数。

例子:“Leaveout”,“上”

Hyperparameters

全部折叠

`“MaxNumSplits”`- - - - - -决策分裂的最大数目
`size(X,1) - 1`(默认)|正整数

决策分割(或分支节点)的最大数量，指定为由逗号分隔的对“MaxNumSplits”一个正整数。fitrtree分裂MaxNumSplits或者分支节点更少。有关拆分行为的详细信息，请参见树深控制。

例子:“MaxNumSplits”,5

数据类型:单|双

`“MinLeafSize”`- - - - - -最小叶节点观测数
`1`(默认)|正整数值

最小叶节点观测数，指定为由逗号分隔的对“MinLeafSize”一个正整数。每片叶子至少有MinLeafSize每片树叶的观测值。如果两者都有MinParentSize和MinLeafSize，fitrtree使用更大叶子的设置:MinParentSize = max(MinParentSize,2*MinLeafSize)。

例子:“MinLeafSize”,3

数据类型:单|双

`“NumVariablesToSample”`- - - - - -为每个分裂随机选择的预测数
`“所有”`(默认)|正整数值

为每个分割随机选择的预测数，指定为由逗号分隔的对组成“NumVariablesToSample”一个正整数。或者，您可以指定“所有”使用所有可用的预测因子。

如果训练数据包含许多预测因子，并且您希望分析预测因子的重要性，则指定“NumVariablesToSample”作为“所有”。否则，软件可能不会选择一些预测因子，低估了它们的重要性。

要重新生成随机选择，必须使用rng并指定“重现”,真的。

例子:“NumVariablesToSample”,3

数据类型:字符|字符串|单|双

Hyperparameter优化

全部折叠

`“OptimizeHyperparameters”`- - - - - -需要优化的参数
`“没有”`(默认)|`“汽车”`|`“所有”`|符合条件的参数名称的字符串数组或单元格数组|向量的`optimizableVariable`对象

要优化的参数，指定为由逗号分隔的对“OptimizeHyperparameters”以及以下其中之一:

“没有”—不优化。
“汽车”——使用{' MinLeafSize '}。
“所有”—优化所有符合条件的参数。
符合条件的参数名称的字符串数组或单元格数组。
向量的optimizableVariable对象的输出hyperparameters。

的交叉验证损失(错误)最小化fitrtree通过改变参数。控件来控制交叉验证类型和优化的其他方面HyperparameterOptimizationOptions名称-值对。

请注意

“OptimizeHyperparameters”值将覆盖使用其他名称-值对参数设置的任何值。例如，设置“OptimizeHyperparameters”来“汽车”导致“汽车”值要应用。

的合格参数fitrtree是:

MaxNumSplits- - - - - -fitrtree在整数之间搜索，默认情况下在范围内按对数缩放NumObservations-1[1,马克斯(2))。
MinLeafSize- - - - - -fitrtree在整数之间搜索，默认情况下在范围内按对数缩放[1,马克斯(2楼(NumObservations / 2)))。
NumVariablesToSample- - - - - -fitrtree不对该超参数进行优化。如果你通过了NumVariablesToSample作为参数名，fitrtree简单地使用全部的预测数。然而,fitrensemble对这个超参数进行优化。

通过传递的向量来设置非默认参数optimizableVariable具有非默认值的对象。例如,

负载carsmall参数=超参数(“fitrtree”(功率、重量),MPG);参数(1)。Range = [1,30];

通过参数个数的值OptimizeHyperparameters。

默认情况下，在命令行中出现迭代显示，并根据优化中的超参数数量出现绘图。对于优化和绘图，目标函数为Log(1 +交叉验证损失)用于回归和误分类率用于分类。要控制迭代显示，请设置详细的田野“HyperparameterOptimizationOptions”名称-值对参数。要控制情节，设置ShowPlots田野“HyperparameterOptimizationOptions”名称-值对参数。

使用示例请参见优化回归树。

例子:“汽车”

`“HyperparameterOptimizationOptions”`- - - - - -优化选项
结构

优化选项，指定为由。组成的逗号分隔对“HyperparameterOptimizationOptions”还有一个结构。的效果OptimizeHyperparameters名称-值对参数。结构中的所有字段都是可选的。

字段名	值	默认的
`优化器`	`“bayesopt”`—使用贝叶斯优化。在内部，此设置调用`bayesopt`。 `“gridsearch”`-使用网格搜索`NumGridDivisions`每个维度的值。 `“randomsearch”`-随机搜索`MaxObjectiveEvaluations`点。 `“gridsearch”`以随机顺序搜索，使用均匀采样，而不需要从网格中替换。优化后，您可以使用该命令以网格顺序获得一个表`sortrows (Mdl.HyperparameterOptimizationResults)`。	`“bayesopt”`
`AcquisitionFunctionName`	`“expected-improvement-per-second-plus”` `“expected-improvement”` `“expected-improvement-plus”` `“expected-improvement-per-second”` `“lower-confidence-bound”` `“probability-of-improvement”` 获取函数的名称包括`每秒`不要产生可重复的结果，因为优化取决于目标函数的运行时间。获取函数的名称包括`+`当他们过度开发一个区域时，改变他们的行为。有关详细信息，请参见采集功能类型。	`“expected-improvement-per-second-plus”`
`MaxObjectiveEvaluations`	目标函数评价的最大次数。	`30.`为`“bayesopt”`或`“randomsearch”`，以及整个电网`“gridsearch”`
`MaxTime`	时间限制，指定为正实数。时间限制以秒为单位，由`抽搐`和`toc`。运行时间可以超过`MaxTime`因为`MaxTime`不会中断函数求值。	`正`
`NumGridDivisions`	为`“gridsearch”`表示每个维度中值的个数。该值可以是表示每个维度的值的正整数向量，也可以是适用于所有维度的标量。对于分类变量，此字段将被忽略。	`10`
`ShowPlots`	指示是否显示图形的逻辑值。如果`真正的`，该字段根据迭代次数绘制最佳目标函数值。如果有一个或两个优化参数，如果`优化器`是`“bayesopt”`,然后`ShowPlots`并根据参数绘制了目标函数的模型。	`真正的`
`SaveIntermediateResults`	时是否保存结果的逻辑值`优化器`是`“bayesopt”`。如果`真正的`，此字段覆盖名为`“BayesoptResults”`在每次迭代中。变量是a`BayesianOptimization`对象。	`假`
`详细的`	显示到命令行。 `0`-无迭代显示 `1`-迭代显示 `2`-具有额外信息的迭代显示详细信息请参见`bayesopt详细的`名称-值对参数。	`1`
`UseParallel`	指示是否并行运行贝叶斯优化的逻辑值，这需要parallel Computing Toolbox™。由于并行时序的不可再现性，并行贝叶斯优化不一定产生可再现的结果。有关详情，请参阅并行贝叶斯优化。	`假`
`重新分区`	指示是否在每次迭代时重新划分交叉验证的逻辑值。如果`假`，优化器使用单个分区进行优化。 `真正的`通常给出最鲁棒的结果，因为这种设置考虑了分区噪声。然而，为了获得好的结果，`真正的`至少需要两倍的函数求值。	`假`
请使用以下三个字段名中的一个。
`CVPartition`	一个`cvpartition`对象创建的`cvpartition`。	`“Kfold”,5`如果未指定任何交叉验证字段
`坚持`	范围内的标量`(0,1)`表示保留分数。
`Kfold`	大于1的整数。

例子:“HyperparameterOptimizationOptions”、结构(MaxObjectiveEvaluations, 60)

数据类型:结构体

输出参数

全部折叠

`树`-回归树
回归树对象

回归树，作为回归树对象返回。使用“Crossval”，“KFold”，“坚持”，“Leaveout”,或“CVPartition”选项的结果是一个类树RegressionPartitionedModel。你不能用分区树进行预测，所以这种树没有预测方法。

否则,树是一流的RegressionTree，你可以使用预测预测的方法。

提示

默认情况下,修剪是“上”。然而，这个规范并没有修剪回归树。要修剪经过训练的回归树，将回归树传递给修剪。
在训练模型之后，您可以生成预测新数据响应的C/ c++代码。生成C/ c++代码需要MATLAB编码器™。有关详情，请参阅代码生成简介。

算法

全部折叠

节点拆分规则

fitrtree使用这些进程来确定如何分割节点t。

对于标准CART(即，如果)PredictorSelection是“allpairs”)以及所有预测因素x_我，我= 1,…,p：
1. fitrtree计算节点中响应的加权均方误差(MSE)t使用
  
  $ε_{t} ＝ \sum_{j \in T} w_{j} {（ y_{j} - {\bar{y}}_{t} ）}^{2} 。$
  
  w_j是观察的权重吗j,T是否所有观测指标的集合在节点中t。如果不指定权重,然后w_j= 1 /n,在那里n是样本量。
2. fitrtree估计观测值在节点中的概率t使用
  
  $P （ T ）＝ \sum_{j \in T} w_{j} 。$
3. fitrtree排序x_我按升序排列。排序预测器的每个元素都是一个分裂候选点或切点。fitrtree记录与集合中缺失值对应的所有索引T_U，即未分割集。
4. fitrtree确定分割节点的最佳方式t使用x_我通过最大限度地降低MSE (Δ)我)胜过所有分裂的候选人。也就是说，对于所有分裂的候选人来说x_我：
  1. fitrtree在节点中拆分观察值t分为左右子节点(t_l和t_R分别)。
  2. fitrtree计算Δ我。假设对于一个特定的分裂候选，t_l和t_R集合中包含观测指标T_l和T_R,分别。
    
    如果x_我不包含任何缺失值，则当前分裂候选的MSE减少为
    
    $Δ 我＝ P （ T ） ε_{t} - P （ T_{l} ） ε_{t_{l}} - P （ T_{R} ） ε_{t_{R}} 。$
    
    如果x_我包含缺失值，那么，假设观测值随机缺失，则MSE的减少为
    
    $Δ 我_{U} ＝ P （ T - T_{U} ） ε_{t} - P （ T_{l} ） ε_{t_{l}} - P （ T_{R} ） ε_{t_{R}} 。$
    
    T- - - - - -T_U是否所有观测指标的集合在节点中t这些都没有缺失。
    
    如果你使用代理决策分裂,那么:
    
    fitrtree计算联想的预测措施在决定分裂之间x_j<u所有可能的决定都是分裂的x_k<v，j≠k。
    
    fitrtree根据与最优分裂的关联预测度量，按降序对可能的备选决策分裂进行排序。代理分割是产生最大度量的决策分割。
    
    fitrtree为缺少值的观测值决定子节点分配x_我使用代理分割。如果代理预测器也包含缺失值，则fitrtree使用与第二大度量相分离的决策，依此类推，直到没有其他替代。这是可能的fitrtree在节点上分割两个不同的观测值t使用两个不同的代理拆分。例如，假设预测器x₁和x₂预测器的最佳和次优替代物分别是什么x_我，我{1,2}，在节点t。如果观察米的预测x_我缺失(即，x_心肌梗死是失踪)，但是x_米1难道不是思念，那么x₁是观察的替代预测器吗x_心肌梗死。如果观察x_{（米+ 1),我}和x（米+ 1),1都不见了，但是x_{（米+ 1), 2}难道不是思念，那么x₂是观察的替代预测器吗米+ 1。
    
    fitrtree使用适当的MSE减小公式。也就是说，如果fitrtree未能分配节点中所有缺失的观测值t到使用代理拆分的子节点，则MSE减少为Δ我_U。否则,fitrtree使用Δ我的MSE减小。
  3. fitrtree选择产生最大MSE降低的候选项。
fitrtree在使MSE减小最大化的切点上分割预测变量。
对于曲率测试(即，如果PredictorSelection是“弯曲”）：
1. fitrtree计算残差 $r_{t 我} ＝ y_{t 我} - {\bar{y}}_{t}$ 对于节点中的所有观测值t。 ${\bar{y}}_{t} ＝ \frac{1}{\sum_{我} w_{我}} \sum_{我} w_{我} y_{t 我}$ ，即节点响应的加权平均值t。权重是观测值的权重权重。
2. fitrtree根据相应残差的符号将观测值分配到两个箱子中的一个。让z_t是一个标称变量，它包含节点中观测值的bin赋值t。
3. fitrtree进行弯曲测试在每个预测器和z_t。对于回归树，K= 2。
  - 如果所有p-值至少为0.05fitrtree不拆分节点t。
  - 如果有最小值p值,然后fitrtree选择相应的预测器来分割节点t。
  - 如果不止一个p-value由于下溢而为零fitrtree将标准CART应用于相应的预测因子以选择拆分预测因子。
4. 如果fitrtree选择一个分割预测器，然后它使用标准CART来选择切割点(参见标准CART过程中的第4步)。
对于交互测试(即，如果)PredictorSelection是“interaction-curvature”）：
1. 对于节点的观测t，fitrtree进行弯曲测试在每个预测器和响应之间交互测试在每对预测因子和响应之间。
  - 如果所有p-值至少为0.05fitrtree不拆分节点t。
  - 如果有最小值p-值，它是曲率测试的结果，那么fitrtree选择相应的预测器来分割节点t。
  - 如果有最小值p-值，它是一个交互测试的结果，那么fitrtree在相应的预测因子对上使用标准CART选择分割预测因子。
  - 如果不止一个p-value由于下溢而为零fitrtree将标准CART应用于相应的预测因子以选择拆分预测因子。
2. 如果fitrtree选择一个分割预测器，然后它使用标准CART来选择切割点(参见标准CART过程中的第4步)。

树深控制

如果MergeLeaves是“上”和PruneCriterion是mse的(这是这些名称-值对参数的默认值)，那么软件只对叶子应用修剪，并使用MSE。该规范相当于合并来自同一父节点的叶子，其MSE最多为其两个叶子的MSE之和。
以适应MaxNumSplits，fitrtree拆分当前的所有节点层，然后计算分支节点的个数。层是与根节点等距离的节点集合。分支节点数量超过MaxNumSplits，fitrtree遵循以下程序:
1. 确定当前层中有多少分支节点必须不分裂，以便最多有MaxNumSplits分支节点。
2. 按杂质增益对分支节点进行排序。
3. 取消最不成功分支的数目。
4. 返回到目前为止生长的决策树。
这个过程产生最大平衡的树。
软件逐层拆分分支节点，直到至少发生以下事件之一:
- 有MaxNumSplits分支节点。
- 建议的分割导致至少一个分支节点上的观察数少于MinParentSize。
- 建议的分割导致至少一个叶节点上的观察数小于MinLeafSize。
- 该算法无法在一层内找到一个好的分割(即，剪枝准则)PruneCriterion)，并不是对一个层中所有提议的分割都有改善)。一种特殊情况是当所有节点都是纯节点时(即节点中的所有观察值都具有相同的类)。
- 对于价值观“弯曲”或“interaction-curvature”的PredictorSelection，所有测试产生p-值大于0.05。
MaxNumSplits和MinLeafSize不要在默认值下影响分割。因此，如果设置“MaxNumSplits”的值可能会导致分裂停止MinParentSize之前,MaxNumSplits将发生。

并行化

对于双核及以上系统，fitrtree使用英特尔并行训练决策树^®线程构建块(TBB)。有关英特尔TBB的详细信息，请参见https://software.intel.com/en-us/intel-tbb。

参考文献

[1] Breiman, L.， J. Friedman, R. Olshen和C. Stone。分类与回归树。博卡拉顿，佛罗里达州:CRC出版社，1984。

[10]陆炜英，“基于无偏变量选择和交互检测的回归树”。Statistica中央研究院， 2002年第12卷，第361-386页。

[3] Loh, W.Y.和Y.S. Shih。分类树的拆分选择方法。Statistica中央研究院， 1997年第7卷，第815-840页。

扩展功能

高大的数组
使用行数超过内存容量的数组进行计算。

使用注意事项和限制:

有关更多信息，请参见高大的数组。

自动平行支撑金宝app
通过使用并行计算工具箱™自动运行并行计算来加速代码。

执行并行超参数优化，请使用“HyperparameterOptimizationOptions”、结构(UseParallel,真的)此函数调用中的名称-值对参数。

有关并行超参数优化的更多信息，请参见并行贝叶斯优化。

有关并行计算的更多一般信息，请参见运行MATLAB函数与自动并行支持金宝app(并行计算工具箱)。

另请参阅

预测|修剪|RegressionPartitionedModel|RegressionTree|surrogateAssociation

主题

在分类树中拆分分类预测器

在R2014a中引入

fitrtree

语法

描述

例子

构建回归树

控制回归树深度

优化回归树

无偏预测器重要性估计

在Tall数组上控制最大树深度

在Tall数组上优化回归树

输入参数

资源描述- - - - - -样本数据表格

ResponseVarName- - - - - -响应变量名称中的变量名称资源描述

公式- - - - - -反应变量和预测变量子集的解释模型特征向量|字符串标量

Y- - - - - -响应数据数值列向量

X- - - - - -预测数据数字矩阵

名称-值对参数

“CategoricalPredictors”- - - - - -分类预测表正整数向量|逻辑向量|字符矩阵|字符串数组|字符向量的单元数组|“所有”

“MaxDepth”- - - - - -最大树深正整数

“MergeLeaves”- - - - - -叶合并标志“上”(默认)|“关闭”

“MinParentSize”- - - - - -最小分支节点观测数10(默认)|正整数值

“NumBins”- - - - - -数字预测器的箱数［］(空的)(默认)|正整数标量

“PredictorNames”- - - - - -预测变量名称唯一名称的字符串数组|唯一字符向量的单元数组

“PredictorSelection”- - - - - -用于选择最佳分割预测器的算法“allsplits”(默认)|“弯曲”|“interaction-curvature”

“删除”- - - - - -估计最优修剪子树序列的标志“上”(默认)|“关闭”

“PruneCriterion”- - - - - -修剪的标准mse的(默认)

“QuadraticErrorTolerance”- - - - - -二次误差容限1 e-6(默认)|正标量值

“复制”- - - - - -标志来强制再现性假(逻辑0）(默认)|真正的(逻辑1）

“ResponseName”- - - - - -响应变量名称“Y”(默认)|特征向量|字符串标量

“ResponseTransform”- - - - - -响应转换“没有”(默认)|函数处理

“SplitCriterion”- - - - - -划分的标准MSE的(默认)

“代孕”- - - - - -代理决策分割标志“关闭”(默认)|“上”|“所有”|正整数

“重量”- - - - - -观察权重(大小(X, 1), 1)(默认)|标量值向量|中的变量名称资源描述

“CrossVal”- - - - - -交叉验证标志“关闭”(默认)|“上”

“CVPartition”- - - - - -交叉验证树的分区cvpartition对象

“坚持”- - - - - -保留验证的数据部分0(默认)|范围内的标量值[0, 1]

“KFold”- - - - - -折叠数10(默认)|大于1的正整数

“Leaveout”- - - - - -留一个交叉验证标志“关闭”(默认)|“上”

“MaxNumSplits”- - - - - -决策分裂的最大数目size(X,1) - 1(默认)|正整数

“MinLeafSize”- - - - - -最小叶节点观测数1(默认)|正整数值

“NumVariablesToSample”- - - - - -为每个分裂随机选择的预测数“所有”(默认)|正整数值

“OptimizeHyperparameters”- - - - - -需要优化的参数“没有”(默认)|“汽车”|“所有”|符合条件的参数名称的字符串数组或单元格数组|向量的optimizableVariable对象

“HyperparameterOptimizationOptions”- - - - - -优化选项结构

输出参数

树-回归树回归树对象

更多关于

弯曲测试

交互测试

联想的预测测量

代理决策分裂

提示

算法

节点拆分规则

树深控制

并行化

参考文献

扩展功能

高大的数组使用行数超过内存容量的数组进行计算。

自动平行支撑金宝app通过使用并行计算工具箱™自动运行并行计算来加速代码。

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:MATLAB分步指南

`资源描述`- - - - - -样本数据
表格

`ResponseVarName`- - - - - -响应变量名称
中的变量名称`资源描述`

`公式`- - - - - -反应变量和预测变量子集的解释模型
特征向量|字符串标量

`Y`- - - - - -响应数据
数值列向量

`X`- - - - - -预测数据
数字矩阵

`“CategoricalPredictors”`- - - - - -分类预测表
正整数向量|逻辑向量|字符矩阵|字符串数组|字符向量的单元数组|`“所有”`

`“MaxDepth”`- - - - - -最大树深
正整数

`“MergeLeaves”`- - - - - -叶合并标志
`“上”`(默认)|`“关闭”`

`“MinParentSize”`- - - - - -最小分支节点观测数
`10`(默认)|正整数值

`“NumBins”`- - - - - -数字预测器的箱数
`［］`(空的)(默认)|正整数标量

`“PredictorNames”`- - - - - -预测变量名称
唯一名称的字符串数组|唯一字符向量的单元数组

`“PredictorSelection”`- - - - - -用于选择最佳分割预测器的算法
`“allsplits”`(默认)|`“弯曲”`|`“interaction-curvature”`

`“删除”`- - - - - -估计最优修剪子树序列的标志
`“上”`(默认)|`“关闭”`

`“PruneCriterion”`- - - - - -修剪的标准
`mse的`(默认)

`“QuadraticErrorTolerance”`- - - - - -二次误差容限
`1 e-6`(默认)|正标量值

`“复制”`- - - - - -标志来强制再现性
`假`(逻辑`0`）(默认)|`真正的`(逻辑`1`）

`“ResponseName”`- - - - - -响应变量名称
`“Y”`(默认)|特征向量|字符串标量

`“ResponseTransform”`- - - - - -响应转换
`“没有”`(默认)|函数处理

`“SplitCriterion”`- - - - - -划分的标准
`MSE的`(默认)

`“代孕”`- - - - - -代理决策分割标志
`“关闭”`(默认)|`“上”`|`“所有”`|正整数

`“重量”`- - - - - -观察权重
`(大小(X, 1), 1)`(默认)|标量值向量|中的变量名称`资源描述`

`“CrossVal”`- - - - - -交叉验证标志
`“关闭”`(默认)|`“上”`

`“CVPartition”`- - - - - -交叉验证树的分区
`cvpartition`对象

`“坚持”`- - - - - -保留验证的数据部分
`0`(默认)|范围内的标量值`[0, 1]`

`“KFold”`- - - - - -折叠数
`10`(默认)|大于1的正整数

`“Leaveout”`- - - - - -留一个交叉验证标志
`“关闭”`(默认)|`“上”`

`“MaxNumSplits”`- - - - - -决策分裂的最大数目
`size(X,1) - 1`(默认)|正整数

`“MinLeafSize”`- - - - - -最小叶节点观测数
`1`(默认)|正整数值

`“NumVariablesToSample”`- - - - - -为每个分裂随机选择的预测数
`“所有”`(默认)|正整数值

`“OptimizeHyperparameters”`- - - - - -需要优化的参数
`“没有”`(默认)|`“汽车”`|`“所有”`|符合条件的参数名称的字符串数组或单元格数组|向量的`optimizableVariable`对象

`“HyperparameterOptimizationOptions”`- - - - - -优化选项
结构

`树`-回归树
回归树对象

高大的数组
使用行数超过内存容量的数组进行计算。

自动平行支撑金宝app
通过使用并行计算工具箱™自动运行并行计算来加速代码。