主要内容

分类学习器应用程序中的训练分类模型

您可以使用分类学习器来训练这些分类器的模型:决策树、判别分析、支持向量机、逻辑回归、最近邻、朴素贝叶斯、核近似、集成和神经网络。除了培训模型外,您还可以浏览数据、选择功能、指定验证方案和评估结果。您可以将模型导出到工作空间,金宝app以使用具有新数据的模型或生成MATLAB®用于了解编程分类的代码。

分类学习者模型培训包括两部分:

  • 验证模型:使用验证方案培训模型。默认情况下,应用程序通过应用交叉验证防止过度拟合。或者,您可以选择保持验证。验证模型在应用程序中可见。

  • 完整模型:在没有验证的情况下,根据完整数据对模型进行训练。应用程序将同时训练该模型和验证模型。但是,基于完整数据训练的模型在应用程序中不可见。选择要导出到工作区的分类器时,“分类学习器”将导出完整模型。

应用程序显示验证模型的结果。诊断度量(如模型精度)和绘图(如散点图或混淆矩阵图)反映了经验证的模型结果。您可以自动训练一个或多个分类器,比较验证结果,并选择适用于您的分类问题的最佳模型。选择要导出到工作区的模型时,分类学习器将导出完整模型。因为“分类学习者”在培训期间创建了完整模型的模型对象,所以导出模型时不会出现延迟。可以使用导出的模型对新数据进行预测。

要开始培训一系列模型类型,请参见自动分类器训练. 如果您已经知道要训练的分类器类型,请参阅人工分类器训练.

自动分类器训练

您可以使用“分类学习器”自动训练数据上不同分类模型的选择。

  • 通过一次自动训练多个模型开始。您可以快速尝试选择模型,然后以交互方式探索有前途的模型。

  • 如果你已经知道你想要什么样的分类器类型,那就训练单个分类器。看见人工分类器训练.

  1. 应用程序选项卡,在机器学习与深度学习组,单击分类学习者.

  2. 点击新会议并从工作区或文件中选择数据。指定响应变量和用作预测值的变量。请参阅为分类问题选择数据和验证.

  3. 分类学习者选项卡,在模型类型部分,单击都快去训练了. 此选项可训练所有可用于数据集的快速拟合模型预设。

  4. 点击火车.

    笔记

    如果你有并行计算工具箱™, 您可以并行地训练模型。看见并行分类器训练.

    选择的模型类型将显示在中模型窗玻璃当模型完成训练时,最佳百分比准确性(验证)分数在框中突出显示。

  5. 单击中的“模型”模型窗格并打开相应的绘图以浏览结果。

    有关后续步骤,请参阅人工分类器训练比较和改进分类模型.

  6. 要尝试所有可用于数据集的不可优化分类器模型预设,请单击全部的,然后单击火车.

人工分类器训练

如果您想探索单个模型类型,或者如果您已经知道您想要的分类器类型,则可以一次训练一个分类器或训练一组相同类型的分类器。

  1. 选择一个分类器。上分类学习者选项卡,在模型类型节中,单击分类器类型。要查看所有可用的分类器选项,请单击模型类型节以展开分类器列表。中的不可优化模型选项模型类型gallery是具有不同设置的预设起点,适用于一系列不同的分类问题。

    要读取每个分类器的描述,请切换到详细信息视图。

    有关每个选项的详细信息,请参见选择分类器选项.

  2. 选择分类器后,单击火车.

    重复以尝试不同的分类器。

    提示

    首先尝试决策树和判别法。如果模型不能足够准确地预测响应,可以尝试其他更灵活的分类器。为避免过度拟合,请寻找灵活性较低且具有足够精度的模型。

  3. 如果要尝试相同或不同类型的所有不可优化模型,请选择以下选项之一:全部的中的选项模型类型陈列室

    或者,如果要自动调整特定模型类型的超参数,请选择相应的可优化建模并执行超参数优化。有关详细信息,请参阅分类学习应用程序中的超参数优化.

有关后续步骤,请参阅比较和改进分类模型

并行分类器训练

如果您有并行计算工具箱,您可以使用Classification Learner并行训练模型。并行训练允许您一次训练多个分类器并继续工作。

要控制并行训练,请切换使用并行应用程序工具条上的按钮。这个使用并行只有当您有并行计算工具箱时,按钮才可用。

第一次单击火车单击使用并行按钮,当应用程序打开一个平行的工作人员池时,将显示一个对话框。池打开后,可以同时训练多个分类器。

当分类器并行训练时,进程指示器将显示在中的每个训练和排队模型上模型窗玻璃如果需要,可以取消单个型号。在训练期间,您可以检查模型的结果和绘图,并开始训练更多分类器。

如果您有并行计算工具箱,那么在Classification Learner中可以使用并行培训,并且您不需要设置使用并行选择权斯塔塞特作用

笔记

不能并行执行超参数优化。应用程序将禁用使用并行当您选择一个可优化的模型时,单击该按钮。如果然后选择不可优化的模型,则默认情况下该按钮处于禁用状态。

比较和改进分类模型

  1. 检查准确性(验证)报告中的分数模型每个模型的窗格。单击中的“模型”模型窗格并打开相应的绘图以浏览结果。通过检查图中的结果来比较模型性能。可以重新排列打印布局,以跨多个模型比较结果:使用中的选项布局按钮,拖放绘图,或选择文档操作箭头提供的选项位于“模型打印”选项卡的右侧。

    此外,您还可以使用排序中的选项模型窗玻璃通过选择模型并单击删除所选模型按钮,或右键单击模型并选择删除模型.

    看见评估分类器在分类学习者中的性能.

  2. 在列表中选择最佳模型模型窗格,然后尝试在模型中包含和排除不同的功能。点击特征选择.

    尝试使用平行坐标图来帮助您识别要删除的功能。查看是否可以通过删除预测能力较低的功能来改进模型。指定要包含在模型中的预测值,并使用新选项训练新模型。在中比较模型之间的结果模型窗玻璃

    您还可以尝试使用PCA变换特征以降低维数。

    看见使用分类学习器App进行特征选择和特征转换.

  3. 要进一步改进模型,可以尝试在“高级”对话框中更改分类器参数设置,然后使用新选项进行训练。要了解如何控制模型灵活性,请参阅选择分类器选项. 有关如何自动调整模型参数设置的信息,请参见分类学习应用程序中的超参数优化.

  4. 如果特征选择、PCA或新参数设置改善了模型,请尝试训练全部的使用新设置的模型类型。查看其他模型类型是否使用新设置效果更好。

提示

为避免过度拟合,请寻找灵活性较低且具有足够精度的模型。例如,寻找简单的模型,例如快速且易于解释的决策树和判别式。如果模型不能足够准确地预测响应,请选择其他具有更高灵活性的分类器,如集合。要了解模型灵活性,请参见选择分类器选项.

此图显示了具有模型包含各种分类器类型的窗格。

有关比较不同分类器的逐步示例,请参见使用分类学习器应用程序训练决策树.

对于下一步,生成代码以使用不同的数据训练模型,或者将训练过的模型导出到工作区以使用新数据进行预测。看见用于预测新数据的导出分类模型.

相关话题