主要内容

在分类学习者应用程序中训练分类模型

您可以使用分类学习器来训练这些分类器的模型:决策树、判别分析、支持向量机、逻辑回归、最近邻、朴素贝叶斯、核近似、集成和神经网络。金宝app除了训练模型,您还可以探索数据、选择特性、指定验证方案和评估结果。您可以将模型导出到工作区,以使用带有新数据的模型或生成MATLAB®代码以了解程序分类。

分类学习者模型的训练包括两部分:

  • 验证模型:使用验证方案训练模型。默认情况下,应用程序通过应用交叉验证来防止过拟合。或者,您可以选择拒绝验证。经过验证的模型在应用程序中可见。

  • 完整模型:在不进行验证的情况下对模型进行完整数据训练。该应用程序同时训练这个模型和已验证的模型。然而,在应用程序中看不到完整数据训练的模型。当你选择一个分类器来导出到工作空间时,Classification Learner会导出完整的模型。

该应用程序显示验证模型的结果。诊断措施,如模型准确性,和图,如散点图或混淆矩阵图,反映验证的模型结果。您可以自动训练一个或多个分类器,比较验证结果,并选择适合您的分类问题的最佳模型。当您选择要导出到工作区中的模型时,Classification Learner会导出完整的模型。因为Classification Learner在训练期间创建了完整模型的模型对象,所以在导出模型时不会有延迟时间。您可以使用导出的模型对新数据进行预测。

要开始训练模型类型的选择,请参见自动分类器训练.如果你已经知道你想要训练的分类器类型,请看手工分类器训练

自动分类器训练

你可以使用分类学习器在你的数据上自动训练不同的分类模型。

  • 开始自动训练多个模型一次。您可以快速地尝试选择一些模型,然后交互地探索有希望的模型。

  • 如果您已经知道您想要的分类器类型,那么就训练单独的分类器。看到手工分类器训练

  1. 应用程序选项卡,机器学习和深度学习组中,单击分类学习者

  2. 点击新会话并从工作区或文件中选择数据。指定响应变量和用作预测器的变量。看到选择分类问题的数据和验证

  3. 分类学习者选项卡,模型类型部分中,点击所有Quick-To-Train.这个选项训练所有的模型预置为您的数据集是快速适合。

  4. 点击火车

    请注意

    如果您有Parallel Computing Toolbox™,您可以并行地训练模型。看到并行分类器训练

    中显示了模型类型的选择模型窗格。当模特们完成训练,最好的百分比准确性(验证)分数在方框中高亮显示。

  5. 单击模型窗格并打开相应的图以查看结果。

    有关下一步,请参见手工分类器训练比较和改进分类模型

  6. 要尝试您的数据集可用的所有不可优化的分类器模型预置,请单击所有,然后单击火车

手工分类器训练

如果您想研究单个模型类型,或者如果您已经知道您想要的分类器类型,您可以一次训练一个分类器,或者训练一组相同类型的分类器。

  1. 选择一个分类器。在分类学习者选项卡,模型类型节中,单击分类器类型。要查看所有可用的分类器选项,单击最右边的箭头模型类型节以展开分类器列表。中不可优化的模型选项模型类型图库的预设起点有不同的设置,适合各种不同的分类问题。

    要读取每个分类器的描述,请切换到详细视图。

    有关每个选项的更多信息,请参见选择分类器选项

  2. 选择分类器后,单击火车

    重复尝试不同的分类器。

    提示

    首先尝试决策树和判别器。如果模型在预测响应方面不够准确,可以尝试其他具有更高灵活性的分类器。为了避免过度拟合,要寻找灵活性较低但提供足够精度的模型。

  3. 如果您想尝试所有相同或不同类型的不可优化模型,那么选择所有选项的模型类型画廊。

    另外,如果您想自动调优特定模型类型的超参数,请选择相应的Optimizable建立超参数优化模型。有关更多信息,请参见分类学习者应用程序中的超参数优化

有关下一步,请参见比较和改进分类模型

并行分类器训练

如果你有并行计算工具箱,你可以使用分类学习器并行训练模型。并行训练允许您同时训练多个分类器并继续工作。

要控制并行训练,切换使用并行按钮上的应用程序工具条。的使用并行按钮只有在您拥有并行计算工具箱时才可用。

第一次点击火车后单击使用并行按钮,当应用程序打开一个并行的工作人员池时,会显示一个对话框。在池打开后,您可以一次训练多个分类器。

在并行训练分类器时,进度指示器出现在每个训练和队列模型中模型窗格。如果你愿意,你可以取消个别型号。在培训期间,您可以检查来自模型的结果和图,并开始培训更多的分类器。

如果你有并行计算工具箱,那么在分类学习器中可以使用并行训练,你不需要设置UseParallel选择的statset函数。

请注意

不能并行执行超参数优化。应用程序禁用使用并行按钮时,您选择一个可优化的模型。如果您随后选择了一个不可优化的模型,则默认关闭该按钮。

比较和改进分类模型

  1. 检查准确性(验证)报告的分数模型窗格的每个模型。单击模型窗格并打开相应的图以查看结果。通过检查图中的结果来比较模型性能。可以重新安排图的布局,以便在多个模型之间比较结果:使用布局按钮、拖放绘图或选择Document Actions箭头提供的选项位于模型绘图选项卡的右侧。

    此外,您可以使用排序选项的模型窗格。删除任何不需要的模型,方法是选择模型并单击删除选定的模型按钮,或者右键单击模型并选择删除模型

    看到在分类学习中评估分类器的表现

  2. 选择最好的模型在模型窗格,然后尝试在模型中包括和排除不同的功能。点击特征选择

    尝试使用平行坐标图来帮助您识别要删除的特性。看看是否可以通过删除预测能力低的特征来改进模型。指定模型中包含的预测器,并使用新选项培训新模型。比较了模型之间的结果模型窗格。

    您还可以尝试使用PCA转换特性以降低维数。

    看到使用分类学习软件进行特征选择和特征转换

  3. 要进一步改进模型,您可以尝试在Advanced对话框中更改分类器参数设置,然后使用新选项进行训练。要学习如何控制模型的灵活性,请参阅选择分类器选项.有关如何自动调优模型参数设置的信息,请参见分类学习者应用程序中的超参数优化

  4. 如果特征选择、主成分分析或新的参数设置可以改进您的模型,请尝试训练所有模型类型的新设置。看看另一种模型类型是否在新的设置下表现更好。

提示

为了避免过度拟合,要寻找灵活性较低但提供足够精度的模型。例如,寻找简单的模型,如决策树和判别器,它们快速且易于解释。如果模型不能足够准确地预测响应,可以选择具有更高灵活性的其他分类器,如集成器。要了解模型的灵活性,请参见选择分类器选项

这张图显示了带有模型包含各种分类器类型的窗格。

有关比较不同分类器的逐步示例,请参见使用分类学习程序训练决策树

对于下一步,生成代码以使用不同的数据训练模型,或者将训练过的模型导出到工作区,以使用新数据进行预测。看到导出分类模型来预测新数据

相关的话题