主要内容

特征选择和特征转换使用分类学习者应用

调查在散点图特征

在分类学习者,试图确定预测,单独的类通过绘制散点图上的不同对预测。情节可以帮你调查特性包括或排除。你可以想象训练数据散点图和分类错误的点。

在你训练一个分类器,散点图显示数据。如果你已经训练一个分类器,散点图显示了模型预测结果。通过选择开关只绘制数据数据情节控制。

  • 选择阴谋使用特性XY列表下预测

  • 寻找单独的类的预测因子。例如,绘制fisheriris数据,可以看到,花萼长度和萼片宽分开的一个类(setosa)。你需要情节其他预测如果你能单独另两类。

    费舍尔虹膜数据的散点图

  • 显示或隐藏特定的类使用复选框显示

  • 变化的叠加顺序绘制类通过选择下一个类然后点击移到前面

  • 调查细节由缩放和平移整个阴谋。要启用缩放或移动,将鼠标悬停在散点图,然后单击工具栏上的相应按钮出现上图右上角的阴谋。

  • 如果你确定预测不有用的类中分离出来,然后试着用特征选择删除它们和训练分类器只包括最有用的预测因子。

你训练一个分类器后,散点图显示了模型预测结果。您可以显示或隐藏正确或不正确的结果和显示结果的类。看到情节分类器的结果

您可以导出数据散点图里,您在应用程序中创建。看到出口情节分类学习者应用

选择功能包括

在分类学习者,你可以指定不同的特性(或指标)包括在模型中。看你是否能提高模型通过移除特性预测能力较低。如果数据收集是昂贵或困难,你可能更喜欢没有一些预测模型性能良好。

  1. 分类学习者选项卡,特性部分中,点击特征选择

  2. 在特征选择对话框中,明确预测要排除的复选框,然后单击好吧

    特征选择菜单和SepalLength SepalWidth选中,和PetalLength PetalWidth清除

  3. 点击火车培训新模式使用新的预测选项。

  4. 观察的新模型模型窗格。的当前模型的总结窗格显示有多少因素排除在外。

  5. 检查哪些预测包含在训练模式,单击模型模型面板和观察特征选择对话框中的复选框。

  6. 你可以试着改进模型,包括模型中不同的特性。

例如使用特征选择,明白了火车使用分类学习者应用决策树

与PCA变换特性分类学习者

使用主成分分析(PCA)减少预测空间的维数。减少维度可以创建分类模型的分类学习者,防止过度拟合。线性PCA变换预测为了消除冗余的维度,并生成一组新的变量叫做主成分。

  1. 分类学习者选项卡,特性部分中,选择主成分分析

  2. 在高级PCA选项对话框中,选择使主成分分析复选框,然后单击好吧

  3. 当你点击火车,主成分分析函数变换之前选定的特征训练分类器。

  4. 默认情况下,PCA仅保留的组件解释方差的95%。在高级PCA选项对话框中,你可以改变的百分比差异来解释通过选择解释的方差价值。更高的价值风险过度拟合,而较低的价值风险消除有用的维度。

  5. 如果你想手动限制PCA组件的数量,组件降低标准列表中,选择指定数量的组件。选择数字组件的数量价值。组件的数量不能大于数值预测的数量。PCA不应用于分类预测。

检查PCA方法训练模型当前模型的总结面板的信息。检查解释方差的百分比决定是否改变组件的数量。例如:

PCA是保持足够的组件来解释方差的95%。训练后,两部分。解释方差/组件(按顺序):92.5%,5.3%,1.7%,0.5%

了解更多关于如何分类学习者PCA适用于您的数据,生成代码的训练分类器。有关PCA的更多信息,请参阅主成分分析函数。

在平行坐标图特性进行调查

调查特性包括或排除,使用平行坐标图。你可以想象高维数据在一个阴谋看到二维模式。情节可以帮助您理解之间的关系特性和识别有用的预测分离类。你可以想象训练数据和分类错误的点在平行坐标图。当你情节分类器的结果,是不是点虚线。

  1. 分类学习者选项卡,情节部分,单击箭头打开画廊,然后单击平行坐标验证结果组。

  2. 情节,拖动X蜱虫标签重新排序预测。改变订单可以帮助您识别预测,单独的类。

  3. 指定哪个预测情节,使用预测复选框。一个好的实践是一次阴谋几个预测。如果您的数据有许多预测,情节默认显示前10预测。

  4. 如果预测有显著不同的尺度、规模的数据可视化。尝试不同的选择扩展列表:

    • 没有一个显示原始数据在坐标相同的统治者,最小和最大极限。

    • 范围显示原始数据在坐标有独立的最小和最大限度的统治者。

    • z分数显示z得分(平均值为0和1的标准偏差)在每个坐标统治者。

    • 零均值显示数据集中的意思是0在每个坐标统治者。

    • 单位方差显示值缩放通过标准偏差以及每个坐标统治者。

    • L2范数显示2-norm值在每个坐标统治者。

  5. 如果你确定预测不用于分离类,使用特征选择删除它们和训练分类器只包括最有用的预测因子。

的情节fisheriris数据显示花瓣长度和花瓣宽度最好单独的类特性。

平行坐标图显示分类器结果的费舍尔虹膜数据

有关更多信息,请参见parallelplot

您可以导出平行坐标图中创建的应用程序数据。看到出口情节分类学习者应用

相关的话题