特征变换技术通过将数据转变成新的功能降低数据的维度。特征选择技术是优选的,当变量变换是不可能的,例如,当存在在数据分类变量。用于特征选择技术,该技术特别适合于最小二乘拟合,见逐步回归。
了解特征选择算法和探索可供特征选择的功能。
本主题引入了顺序特征选择和提供了选择功能依次使用自定义标准和示例sequentialfs
功能。
邻域成分分析(NCA)是一种非参数的特征选择方法,其目标是最大化回归和分类算法的预测精度。
在不损害模型的预测能力去除预测做一个更强大和更简单的模型。
选择拆分,预测使用交互测试算法随机森林。
叔SNE是用于通过非线性还原可视化高维数据,以两个或三个维度,同时保留原始数据的某些特征的方法。
这个例子中示出了T-SNE如何产生高维数据的有用的低维嵌入。
该示例示出的各种效果tsne
设置。
输出功能的说明和示例对叔SNE。
因子分析是一种将模型与多元数据进行拟合的方法,用以估计被测变量与较少数量的未观察(潜在)因素之间的相互依赖性。
使用因素分析来调查同一行业内的公司是否经历了类似的每周股价变化。
这个例子说明如何进行使用统计和机器学习工具箱™因素分析。
多维尺度,您可以直观近点如何彼此对多种距离或差异性指标,可以在小维数产生的数据的表示。
用cmdscale
执行经典(公制)多维标度,也被称为主坐标分析。
这个例子说明如何使用执行经典多维尺度cmdscale
在统计和机器学习工具箱功能™。
此示例示出了如何使用多维标度(MDS)的非经典形式的可视化不相似性数据。
执行使用非经典多维尺度mdscale
。