主要内容

使用回归学习者的火车回归树

这个示例展示了如何使用regression Learner应用程序创建和比较各种回归树,并将训练过的模型导出到工作空间,以便对新数据进行预测。

您可以训练回归树来预测对给定输入数据的响应。要预测回归树的响应,请沿着树从根(开始)节点向下到叶节点。在每个节点上,使用与该节点关联的规则决定遵循哪个分支。继续,直到到达叶节点。预测的响应是与该叶节点相关联的值。

统计和机器学习工具箱™树是二进制的。预测的每一步都需要检查一个预测变量的值。例如,这是一个简单的回归树:

这棵树基于两个预测器预测响应,X1X2.要预测,请在顶部节点开始。在每个节点处,检查预测器的值以确定要遵循的分支。当分支到达叶节点时,响应被设置为与该节点对应的值。

这个例子使用了CARBIG.数据集。该数据集包含自1970年至1982年生产的不同汽车模型的特性,包括:

  • 加速

  • 气缸数

  • 发动机排量

  • 发动机功率(马力)

  • 模型年份

  • 重量

  • 出生国家

  • 每加仑英里(MPG)

火车回归树,以预测每加仑英里的燃料经济的汽车模型,给予其他变量作为输入。

  1. 在matlab.®,加载CARBIG.数据集并创建包含不同变量的表:

    加载CARBIG.Cartable =桌子(加速,气瓶,位移,......马力,车型,年份,重量,来源,MPG);
  2. 在这一点应用选项卡,机器学习和深度学习组,点击回归的学习者

  3. 在这一点回归的学习者选项卡,文件部分,选择新会话>从工作区

  4. 在下面数据集变量在“来自工作区的新会话”对话框中选择手镯从工作区中的表和矩阵列表中。

    观察该应用程序已预选响应和预测变量。MPG.被选为响应,以及所有其他变量作为预测器。对于此示例,请勿更改选择。

  5. 要接受默认的验证方案并继续,请单击开始会议.默认验证选项是交叉验证,以防止过度装备。

    回归学习者创建了一个响应的曲目与记录号X设在。

  6. 使用响应曲线调查哪些变量用于预测响应是有用的。要可视化不同预测器与响应之间的关系,请选择不同的变量X列表X轴

    观察到哪些变量最清晰地相关。移位马力,重量所有对响应都有明显的可见影响,并且都表现出与响应的负面关联。

  7. 选择变量起源在下面X轴.自动显示一个盒子图。盒子图显示了响应和任何可能的异常值的典型值。当绘制标记时,盒子图是有用的,导致重叠的许多点。在当变量上显示一个盒子绘图X-axis有很少的独特价值风格, 选择箱形图

  8. 创建一系列回归树。在这一点回归的学习者选项卡,模型类型部分,点击所有的树

    然后点击火车

    小费

    如果您有并行计算工具箱™,您可以培训所有型号(所有的树)通过选择来同时使用并行按钮在训练点击之前的部分火车.点击后火车,打开并行池对话框打开并保持打开状态,同时应用程序打开并行工作人员池。在此期间,您不能与该软件进行交互。泳池开放后,应用程序会同时训练模特。

    回归学习者创造并列车三个回归树:afine, 一种中树和A.粗树

    这三种模型出现在楷模窗格。检查RMSE(验证)(验证均方根误差)。最好的分数在方框中高亮显示。

    fine中树有类似的RMSE,而粗树不太准确。

    回归学习者绘制真实的训练反应和当前选定模型的预测反应。

    笔记

    如果您使用的是验证,结果中存在一些随机性,因此您的模型验证分数可能与所示结果不同。

  9. 选择一个模型楷模窗格查看该模型的结果。在下面X轴, 选择马力并检查响应情节。现在绘制了真实和预测的答复。显示预测错误,通过选择预测和真正的响应之间绘制为垂直线路,通过选择错误复选框。

  10. 查看当前所选模型的更多详细信息当前模型摘要窗格。检查和比较其他模型特征,如R-squared(决定系数),MAE(平均绝对误差),和预测速度。要了解更多信息,请参阅查看和比较模型统计.在里面当前模型摘要窗格中,您还可以找到有关当前选择的模型类型的详细信息,例如用于训练模型的选项。

  11. 绘制预测的响应与真正的响应。在这一点回归的学习者选项卡,绘图部分,点击预测与实际并选择验证数据.使用此曲线来了解回归模型对不同响应值的预测程度。

    完美的回归模型已经预测了等于真实响应的响应,因此所有点都位于对角线上。从线到任何点的垂直距离是该点预测的错误。一个好的模型有很小的错误,因此预测散布在线附近。通常,一个好的模型在对角线周围大致对称地散射。如果您可以在情节中看到任何明确的模式,您可能会改善您的模型。

  12. 选择其他模型楷模窗格并比较预测的与实际图。

  13. 在里面模型类型画廊,选择所有的树再次。要尝试改进模型,请尝试在模型中包括不同的功能。看看您是否可以通过删除具有低预测电源的功能来改进模型。在这一点回归的学习者选项卡,特征部分,点击特征选择

    在“功能选择”对话框中,清除复选框加速气瓶从预测器中排除它们。

    点击火车使用新的预测仪设置培训新的回归树。

  14. 观察新模型楷模窗格。这些模型与以前是相同的回归树,但仅使用七个预测器中的五个培训。该应用程序显示使用了多少预测器。要检查使用哪些预测器,请单击型号楷模窗格并遵守“功能选择”对话框中的复选框。

    使用所有预测器的模型删除了两个特征的模型。与仅使用预测器的子集相比,模型不再使用所有预测器更好地预测。如果数据收集昂贵或困难,则可能更喜欢一个令人满意地执行令人满意而没有一些预测的模型。

  15. 仅使用三个回归树预设马力作为预测因子。更改“功能选择”对话框中的选择,然后单击火车

    仅使用发动机电源作为预测器的型号,精度较低。但是,模型表现良好,因为它们仅使用单个预测器。通过这种简单的一维预测空间,粗树现在执行以及介质和细树木。

  16. 选择最好的模型在楷模窗格并查看残差情节。在这一点回归的学习者选项卡,绘图部分,点击残差并选择验证数据.残差绘图显示预测和真实响应之间的差异。将残差显示为线图,在风格部分,选择线

    在下面X轴,选择要在绘制的变量X设在。选择真实的反应,预测的反应,记录号码,或你的预测之一。

    通常,一个良好的模型具有大致对称的残留物左右。如果您可以在残差看到任何明确的模式,您可能会改善您的模型。

  17. 要了解模型设置,请选择最佳模型楷模窗格并查看高级设置。非优化的模型选项模型类型图库是预设的起点,您可以更改其他设置。在这一点回归的学习者选项卡,模型类型部分,点击先进的.比较不同的回归树模型楷模窗格,并遵守“高级回归树选项”对话框的差异。这最小叶片尺寸设置控制树叶的大小,并通过回归树的大小和深度。

    要尝试进一步改进模型,改变最小叶片尺寸设置为8,然后单击训练一个新模型火车

    查看所选培训模型的设置当前模型摘要窗格或“高级回归树选项”对话框。

    要了解有关回归树设置的更多信息,请参阅回归树木

  18. 将所选模型导出到工作区。在这一点回归的学习者选项卡,出口部分,点击出口模式.在导出模型对话框中,单击好吧接受默认的变量名训练有素

    要查看有关结果的信息,请查看命令窗口。

  19. 使用导出的模型对新数据进行预测。例如,为预测进行预测手镯您工作区中的数据,输入:

    YFIT = TROORARMODEL.PREDICTFCN(卡特尔)
    输出YFIT.包含每个数据点的预测响应。

  20. 如果要使用新数据自动培训相同的模型或者学习如何编程方式以编程式列回归模型,则可以从应用程序生成代码。为最佳培训的模型生成代码回归的学习者选项卡,出口部分,点击生成功能

    该应用程序从模型生成代码,并在MATLAB编辑器中显示该文件。要了解更多信息,请参阅使用新数据生成MATLAB代码培训模型

小费

使用与此示例中相同的工作流程,以评估和比较您可以在回归学习者中培训的其他回归模型类型。

列出所有非优化回归模型预设:

  1. 在最右边模型类型部分,单击箭头以展开回归模型列表。

  2. 点击全部,然后单击火车

要了解其他回归模型类型,请参阅在回归学习者应用程序中训练回归模型

相关的话题