主要内容

在分类学习者应用程序中训练分类模型

您可以使用分类学习器来训练这些分类器的模型:决策树、判别分析、支持向量机、逻辑回归、最近邻、朴素贝叶斯、核近似、集成和神经网络。金宝app除了训练模型,您还可以探索数据、选择特性、指定验证方案和评估结果。您可以将模型导出到工作区,以使用带有新数据的模型或生成MATLAB®代码以了解程序分类。

分类学习者模型培训包括两部分:

  • 验证模型:使用验证方案培训模型。默认情况下,应用程序通过应用交叉验证来防止过度装配。或者,您可以选择保持验证。已验证的模型在应用程序中可见。

  • 完整模型:在不进行验证的情况下对模型进行完整数据训练。该应用程序同时训练这个模型和已验证的模型。然而,在应用程序中看不到完整数据训练的模型。当你选择一个分类器来导出到工作空间时,Classification Learner会导出完整的模型。

该应用程序显示验证模型的结果。诊断措施,如模型准确性,和图,如散点图或混淆矩阵图,反映验证的模型结果。您可以自动训练一个或多个分类器,比较验证结果,并选择适合您的分类问题的最佳模型。当您选择要导出到工作区中的模型时,Classification Learner会导出完整的模型。因为Classification Learner在训练期间创建了完整模型的模型对象,所以在导出模型时不会有延迟时间。您可以使用导出的模型对新数据进行预测。

要开始培训一系列模型类型,请参见自动分类器训练. 如果您已经知道要训练的分类器类型,请参阅人工分类器训练.

自动分类器训练

你可以使用分类学习器在你的数据上自动训练不同的分类模型。

  • 通过一次自动训练多个模型开始。您可以快速尝试选择模型,然后以交互方式探索有前途的模型。

  • 如果你已经知道你想要什么样的分类器类型,那就训练单个分类器。看见人工分类器训练.

  1. 应用程序选项卡,机器学习和深度学习组中,单击分类学习者.

  2. 点击新会议并从工作区或文件中选择数据。指定一个响应变量和用作预测器的变量。看见为分类问题选择数据和验证.

  3. 分类学习者选项卡,模型类型部分,单击所有Quick-To-Train. 此选项可训练所有可用于数据集的快速拟合模型预设。

  4. 点击火车.

    笔记

    如果你有并行计算工具箱™, 您可以并行地训练模型。看见并行分类器训练.

    中显示了模型类型的选择模型窗格。当模特们完成训练,最好的百分比准确性(验证)分数在方框中高亮显示。

  5. 单击模型窗格并打开相应的绘图以浏览结果。

    有关下一步,请参见人工分类器训练比较和改进分类模型.

  6. 要尝试您的数据集可用的所有不可优化的分类器模型预置,请单击所有,然后单击火车.

人工分类器训练

如果您想探索单个模型类型,或者如果您已经知道您想要的分类器类型,则可以一次训练一个分类器或训练一组相同类型的分类器。

  1. 选择一个分类器。上分类学习者选项卡,模型类型节中,单击分类器类型。要查看所有可用的分类器选项,单击最右边的箭头模型类型节以展开分类器列表。中的不可优化模型选项模型类型图库的预设起点有不同的设置,适合各种不同的分类问题。

    要读取每个分类器的描述,请切换到详细视图。

    有关每个选项的详细信息,请参见选择分类器选项.

  2. 选择分类器后,单击火车.

    重复尝试不同的分类器。

    提示

    首先尝试决策树和判别器。如果模型在预测响应方面不够准确,可以尝试其他具有更高灵活性的分类器。为了避免过度拟合,要寻找灵活性较低但提供足够精度的模型。

  3. 如果要尝试相同或不同类型的所有不可优化模型,请选择以下选项之一:所有选项的模型类型陈列室

    或者,如果要自动调整特定模型类型的超参数,请选择相应的Optimizable建模并执行超参数优化。有关详细信息,请参阅分类学习应用程序中的超参数优化.

有关下一步,请参见比较和改进分类模型

并行分类器训练

如果您有并行计算工具箱,您可以使用Classification Learner并行训练模型。并行训练允许您一次训练多个分类器并继续工作。

要控制并行训练,请切换使用并行按钮上的应用程序工具条。的使用并行只有当您有并行计算工具箱时,按钮才可用。

第一次单击火车单击使用并行按钮,当应用程序打开一个平行的工作人员池时,将显示一个对话框。池打开后,可以同时训练多个分类器。

在并行训练分类器时,进度指示器出现在每个训练和队列模型中模型窗玻璃如果需要,可以取消单个型号。在训练期间,您可以检查模型的结果和绘图,并开始训练更多分类器。

如果您有并行计算工具箱,那么在Classification Learner中可以使用并行培训,并且您不需要设置UseParallel选择权statset作用

笔记

不能并行执行超参数优化。应用程序禁用使用并行当您选择一个可优化的模型时,单击该按钮。如果然后选择不可优化的模型,则默认情况下该按钮处于禁用状态。

比较和改进分类模型

  1. 检查准确性(验证)报告中的分数模型每个模型的窗格。单击中的“模型”模型窗格并打开相应的绘图以浏览结果。通过检查图中的结果来比较模型性能。可以重新排列打印布局,以跨多个模型比较结果:使用中的选项布局按钮,拖放绘图,或选择文档操作箭头提供的选项位于“模型打印”选项卡的右侧。

    此外,您可以使用排序选项的模型窗玻璃通过选择模型并单击删除选定的模型按钮,或右键单击模型并选择删除模型.

    看见评估分类器在分类学习者中的性能.

  2. 选择最好的模型在模型窗格,然后尝试在模型中包含和排除不同的功能。点击特征选择.

    尝试使用平行坐标图来帮助您识别要删除的要素。查看是否可以通过删除具有低预测能力的功能来改进模型。指定要包含在模型中的预测值,并使用新选项训练新模型。比较中各模型的结果模型窗格。

    您还可以尝试使用PCA变换特征以降低维数。

    看见使用分类学习器App进行特征选择和特征转换.

  3. 要进一步改进模型,可以尝试在“高级”对话框中更改分类器参数设置,然后使用新选项进行训练。要了解如何控制模型灵活性,请参见选择分类器选项. 有关如何自动调整模型参数设置的信息,请参见分类学习应用程序中的超参数优化.

  4. 如果特征选择、PCA或新参数设置改善了模型,请尝试训练所有使用新设置的模型类型。查看其他模型类型是否使用新设置效果更好。

提示

为了避免过度拟合,要寻找灵活性较低但提供足够精度的模型。例如,寻找简单的模型,如决策树和判别器,它们快速且易于解释。如果模型不能足够准确地预测响应,可以选择具有更高灵活性的其他分类器,如集成器。要了解模型的灵活性,请参见选择分类器选项.

此图显示了具有模型包含各种分类器类型的窗格。

有关比较不同分类器的逐步示例,请参见使用分类学习程序训练决策树.

对于下一步,生成代码以使用不同的数据训练模型,或者将训练过的模型导出到工作区以使用新数据进行预测。看见导出分类模型来预测新数据.

相关话题