降维和特征提取

主成分分析，因素分析，特征选择，特征提取，等等

特征变换技术通过将数据转换为新特性来降低数据的维数。特征选择技术是优选的，当变量变换是不可能的，例如，当存在在数据分类变量。用于特征选择技术，该技术特别适合于最小二乘拟合，见逐步回归。

功能

特征选择

`fscchi2`	利用卡方检验进行单变量特征排序分类
`fscmrmr`	利用最小冗余最大关联(MRMR)算法对特征进行排序
`fscnca`	利用邻域成分分析进行特征选择分类
`fsrftest`	单因素功能使用回归排名F测试
`fsrnca`	使用回归邻里成分分析的特征选择
`fsulaplacian`	排名采用拉普拉斯得分监督学习功能
`plotPartialDependence`	创建局部依赖图（PDP）和个体条件期望（ICE）地块
`oobPermutedPredictorImportance`	通过对分类树随机森林的袋外预测值的排列估计预测值的重要性
`oobPermutedPredictorImportance`	回归树随机森林的袋外预测值排列估计预测值的重要性
`predictorImportance`	对分类树的预测重要性的估计
`predictorImportance`	预测器在决策树分类集成中的重要性估计
`predictorImportance`	回归树预测因子重要性的估计
`predictorImportance`	预测的重要性估计回归集成
`relieff`	使用ReliefF或RReliefF算法对预测器的重要性进行排序
`sequentialfs`	使用自定义条件进行顺序特性选择
`stepwiselm`	执行逐步回归
`stepwiseglm`	通过逐步回归建立广义线性回归模型

特征提取

`哥斯达黎加`	利用重构ICA进行特征提取
`sparsefilt`	利用稀疏滤波进行特征提取
`变换`	变换预测到提取的特征

t-SNE多维可视化

tsne t分布随机邻接嵌入

PCA和典型相关

`barttest`	巴特利特的测试
`canoncorr`	典型相关
`PCA`	原始数据的主分量分析
`pcacov`	上的协方差矩阵的主成分分析
`pcares`	主成分分析的残差
`PPCA`	概率主成分分析

因子分析

`factoran`	因子分析
`rotatefactors`	旋转因子载荷

非负矩阵分解

nnmf 非负矩阵分解

多维标度

`cmdscale`	经典多维标度
`泰姬陵`	马氏距离
`mdscale`	模多维标度
`pdist`	成对观测之间的距离
`squareform`	格式距离矩阵

普鲁克分析

普罗克汝斯忒斯 普鲁克分析

对象

全部展开

特征选择

`FeatureSelectionNCAClassification`	特征选择用于使用邻里成分分析分类（NCA）
`FeatureSelectionNCARegression`	特征选择用于使用邻里成分分析回归（NCA）

特征提取

`ReconstructionICA`	由重建ICA特征提取
`SparseFiltering`	基于稀疏滤波的特征提取

主题

特征选择

简介特征选择

了解特征选择算法和探索可供特征选择的功能。

连续的特征选择

本主题引入了顺序特征选择和提供了选择功能依次使用自定义标准和示例sequentialfs功能。

邻域成分分析(NCA)特征选择

邻域成分分析(NCA)是一种非参数的特征选择方法，其目标是最大化回归和分类算法的预测精度。

正规化判别分析分类

在不损害模型的预测能力去除预测做一个更强大和更简单的模型。

为随机森林选择预测因子

使用交互测试算法为随机森林选择分裂预测因子。

特征提取

特征提取

特征提取是一组方法，从数据中提取高级别功能。

特征提取流程

这个例子展示了从图像数据中提取特征的完整工作流程。

提取混合信号

这个例子展示了如何使用哥斯达黎加解开混合的音频信号。

t-SNE多维可视化

T-SNE

叔SNE是用于通过非线性还原可视化高维数据，以两个或三个维度，同时保留原始数据的某些特征的方法。

可视化高维数据使用T-SNE

这个例子中示出了T-SNE如何产生高维数据的有用的低维嵌入。

tsne设置

该示例示出的各种效果tsne设置。

叔SNE输出功能

t-SNE的输出函数描述和例子。

PCA和典型相关

主成分分析

主成分分析通过用新的一套是原始变量的线性组合变量更换几个相关的变量减少了数据的维数。

美国分析城市生活质量使用PCA

执行加权主成分分析和解释结果。

因子分析

因子分析

因子分析是一种将模型拟合到多元数据的方法，用来估计被测变量对较少数量的未观察(潜在)因素的相互依赖性。

运用因子分析分析股票价格

使用因子分析来调查同一行业内的公司是否经历了类似的每周股价变化。

对考试成绩进行因素分析

这个例子展示了如何使用统计数据和机器学习工具箱执行因子分析。

非负矩阵分解

非负矩阵分解

非负矩阵分解（NMF)是一种基于特征空间低秩近似的降维技术。

执行非负矩阵分解

使用乘法和交替最小二乘算法进行非负矩阵分解。

多维标度

多维标度

多维标度允许您可视化不同距离或不同度量的点之间的距离，并可以在少量维中生成数据的表示。

古典多维尺度

使用cmdscale执行经典(度量)多维标度，也称为主坐标分析。

古典多维尺度应用到非空间的距离

此示例演示如何使用cmdscale功能在统计和机器学习工具箱™。

非经典多维尺度

这个例子展示了如何使用多维标度(MDS)的非经典形式来可视化不同的数据。

非经典和非度量多维尺度

使用非经典多维缩放mdscale。

普鲁克分析

普鲁克分析

普鲁克分析使用最小化的最佳保形欧几里德变换相比标数据之间的位置中的差异。

比较手写形状使用普鲁克分析

使用普鲁克分析比较两个手写数字。

精选示例

选择用于分类高维数据的特征

选择分级高维数据的功能。更具体地，它示出了如何执行顺序特征选择，这是最流行的特征选择算法之一。它也展示了如何使用维持和交叉验证来评估所选择的功能的性能。

打开脚本

偏最小二乘回归和主成分回归

应用偏最小二乘回归(PLSR)和主成分回归(PCR)方法，讨论了两种方法的有效性。PLSR和PCR都是在预测变量数量较多的情况下对响应变量进行建模的方法，这些预测变量之间存在高度相关甚至共线关系。这两种方法都构造了新的预测变量，称为分量，作为原始预测变量的线性组合，但它们构造这些分量的方式不同。PCR创造了解释预测变量中观察到的变异性的成分，而完全不考虑反应变量。另一方面，PLSR确实考虑了响应变量，因此，模型往往能够用更少的组件来适应响应变量。就其实际应用而言，这最终是否会转化为一个更简洁的模型，取决于上下文。

打开脚本

拟合正交回归的主成分分析

使用主成分分析(PCA)来拟合线性回归。主成分分析使数据到拟合模型的垂直距离最小化。这是正交回归或总最小二乘的线性情况，适用于预测变量和响应变量之间没有自然区别的情况，或所有变量都用误差来测量的情况。这与通常的回归假设相反，预测变量是精确测量的，只有响应变量有误差成分。

打开生活的脚本

降维和特征提取

功能

特征选择

特征提取

t-SNE多维可视化

PCA和典型相关

因子分析

非负矩阵分解

多维标度

普鲁克分析

对象

特征选择

特征提取

主题

特征选择

特征提取

t-SNE多维可视化

PCA和典型相关

因子分析

非负矩阵分解

多维标度

普鲁克分析

精选示例

选择用于分类高维数据的特征

偏最小二乘回归和主成分回归

拟合正交回归的主成分分析

统计和机器学习工具箱文档

金宝app

掌握机器学习：有步骤，分步指南与MATLAB