主要内容

基于回归学习器App的特征选择与特征转换

调查反应图中的特征

在回归学习者中,使用反应图来尝试识别对预测反应有用的预测因子。在以下条件下,将不同预测因子与反应之间的关系可视化X轴,在列表。

在训练回归模型之前,响应图显示训练数据。如果您已经训练了回归模型,那么响应图也会显示模型预测。

观察哪些变量与反应关联最为明显。当你绘制卡比格数据集,预测器马力与反应呈明显的负相关。

寻找与响应和使用没有任何关联的特性特征选择从使用的预测值集中删除这些特征。

您可以将在应用程序中创建的响应图导出为数字。看到了吗在回归学习者应用程序中导出绘图.

选择要包括的功能

在回归学习器中,可以指定要包含在模型中的不同特征(或预测值)。看看是否可以通过删除预测能力低的功能来改进模型。如果数据收集是昂贵或困难的,您可能更喜欢一个模型,表现令人满意的较少预测。

  1. 回归学习者tab,在特征部分,单击特征选择.

  2. 在“要素选择”对话框中,清除要排除的预测值的复选框。

    小费

    可以关闭或移动“要素选择”对话框。您在对话框中所做的选择仍然保留。

  3. 点击列车使用新的预测器选项训练新模型。

  4. 观察汽车里的新车型模型窗格。这个当前模型摘要窗格显示排除了多少预测值。

  5. 检查训练模型中包含哪些预测因子。单击中的模型模型窗格并查看“要素选择”窗口中的复选框。

  6. 尝试通过包含不同的特性来改进模型。

有关使用特征选择的示例,请参见使用回归学习器App训练回归树.

回归学习中PCA变换特征的研究

利用主成分分析(PCA)对预测空间进行降维。降低维度可以在回归学习器中创建回归模型,帮助防止过度拟合。主成分分析(PCA)对预测因子进行线性变换,去除冗余维数,生成一组新的主成分变量。

  1. 回归学习者tab,在特征节,选择主成分分析.

  2. 在“高级PCA选项”对话框中,选择启用PCA复选框。

    可以关闭或移动“PCA”对话框。您在对话框中所做的选择仍然保留。

  3. 点击列车再一次。这个主成分分析函数在训练模型之前变换选定的特征。

    默认情况下,PCA只保留解释95%方差的分量。在“主成分分析”对话框中,可以通过选择解释差异价值观。较高的值有过度拟合的风险,而较低的值有删除有用维度的风险。

  4. 手动限制PCA组件的数量。在成分还原准则列表,选择指定组件数量. 选择数值元件数量价值观。组件的数量不能大于数字预测器的数量。主成分分析不适用于分类预测。

您可以在中检查训练模型的PCA选项当前模型摘要窗格。例如:

主成分分析保留了足够的成分来解释95%的变异。训练后,保留2个组件。每个成分的解释差异(按顺序):92.5%,5.3%,1.7%,0.5%
检查解释的差异百分比以决定是否更改组件的数量。

要进一步了解回归学习者如何将PCA应用于数据,请为经过训练的回归模型生成代码。有关PCA的更多信息,请参阅主成分分析功能。

相关主题