功能转换技术通过将数据转换成新的特征来降低数据中的维数。特征选择当变量的转换不可能时,可以优选技术,例如,当数据中存在分类变量时。对于专门适用于最小二乘拟合的特征选择技术,请参阅逐步回归。
了解要素选择算法并探索功能选择的功能。
本主题介绍了顺序特征选择,并提供了一个使用自定义标准顺序选择功能的示例sequentialfs
功能。
邻域分量分析(NCA)是一种非参数方法,用于选择具有最大化回归和分类算法的预测准确性的目标。
通过删除预测器来制造更强大和更简单的模型,而不会影响模型的预测力。
使用交互测试算法选择随机森林的分裂预测器。
T-SNE是一种通过非线性降低到两种或三维的高维数据的方法,同时保留原始数据的一些特征。
此示例显示T-SNE如何创建高维数据的有用低维嵌入。
这个例子显示了各种影响徐
设置。
t-SNE的输出函数描述和示例。
主成分分析通过用新的一组变量替换若干相关变量来减少数据的维度,这些变量是原始变量的线性组合。
执行加权主组件分析并解释结果。
因子分析是将模型拟合多元数据以估计测量变量对较少数量的未观察(潜在)因子的相互依赖性的方式。
使用因素分析来调查同一部门内的公司是否在股票价格上的同类周期变化。
这个例子展示了如何使用Statistics和Machine Learning Toolbox™执行因子分析。
多维尺度允许您可视化各种距离或不同度量的点之间的距离,并可以在少量维中生成数据的表示。
使用cmdscale
执行经典(度量)多维尺度,也称为主坐标分析。
方法执行经典的多维缩放cmdscale
函数的统计和机器学习工具箱™。
这个示例展示了如何使用非经典的多维尺度(MDS)形式可视化不同的数据。
使用执行非经典的多维缩放mdscale
。
Procrustes分析最大限度地减少了使用最佳形状保护的欧几里德转换比较地标数据之间的位置的差异。
使用Procrustes分析来比较两个手写的数字。