曲调RobustBoost

这个例子使用了:

打开实时脚本

的RobustBoost算法在训练数据存在噪声的情况下也能进行很好的分类预测。但是，默认的RobustBoost参数可以产生一个不能很好预测的集合。这个例子展示了调整参数以获得更好的预测准确性的一种方法。

生成带有标签噪声的数据。本例每个观测值有20个均匀随机数，并将观测值分类为1如果前五个数字的和超过2.5(因此大于平均值)，并且0否则:

rng (0,“旋风”）再现率%Xtrain = rand(2000,20);Ytrain = sum(Xtrain(:，1:5)，2) > 2.5;

为了添加噪声，随机切换10%的分类:

Idx = randsample(2000,200);Ytrain(idx) = ~Ytrain(idx);

用AdaBoostM1为了便于比较:

ada = fitcensemble(x火车，y火车，“方法”，“AdaBoostM1”，.．.“NumLearningCycles”, 300,“学习者”，“树”，“LearnRate”, 0.1);

用RobustBoost．因为数据有10%的错误分类，也许15%的错误目标是合理的。

rb1 = fitcensemble(Xtrain,Ytrain，“方法”，“RobustBoost”，.．.“NumLearningCycles”, 300,“学习者”，“树”，“RobustErrorGoal”, 0.15,.．.“RobustMaxMargin”1);

请注意，如果您将错误目标设置为足够高的值，那么软件将返回一个错误。

创建一个误差目标非常乐观的集合，0.01：

rb2 = fitcensemble(Xtrain,Ytrain，“方法”，“RobustBoost”，.．.“NumLearningCycles”, 300,“学习者”，“树”，“RobustErrorGoal”, 0.01);

比较三种集合的复代误差:

图绘制(resubLoss (rb1“模式”，“累积”));持有在情节(resubLoss而已,“模式”，“累积”)，“r——”）;情节(resubLoss (ada,“模式”，“累积”)，“g”。）;持有从；包含(“树的数量”）;ylabel (“Resubstitution错误”）;传奇(“ErrorGoal = 0.15”，“ErrorGoal = 0.01”，.．.“AdaBoostM1”，“位置”，“不”）;

图中包含一个轴对象。axis对象包含3个line类型的对象。这些对象表示ErrorGoal=0.15, ErrorGoal=0.01, AdaBoostM1。

所有的RobustBoost曲线显示出较低的再置换误差AdaBoostM1曲线。的误差目标0.01曲线显示了在大部分范围内最低的再置换误差。

Xtest = rand(2000,20);Ytest = sum(Xtest(:，1:5)，2) > 2.5;Idx = randsample(2000,200);Ytest(idx) = ~Ytest(idx);图;情节(损失(rb1 Xtest,欧美,“模式”，“累积”));持有在情节(损失(Xtest而已,欧美,“模式”，“累积”)，“r——”）;情节(损失(ada Xtest,欧美,“模式”，“累积”)，“g”。）;持有从；包含(“树的数量”）;ylabel (测试错误的）;传奇(“ErrorGoal = 0.15”，“ErrorGoal = 0.01”，.．.“AdaBoostM1”，“位置”，“不”）;

图中包含一个轴对象。axis对象包含3个line类型的对象。这些对象表示ErrorGoal=0.15, ErrorGoal=0.01, AdaBoostM1。

误差目标为0.15的误差曲线在绘制的范围内最低(最好)。AdaBoostM1具有更高的误差比曲线误差目标0.15。在大多数绘制的范围内，过于乐观的误差目标0.01的曲线仍然大大高于(更差)其他算法。

另请参阅

fitcensemble|resubLoss|损失

曲调RobustBoost

另请参阅

相关的话题