降维和特征提取

主成分分析、因子分析、特征选择、特征提取等

特征变换技术通过将数据转变成新的功能降低数据的维度。特征选择技术是优选的，当变量变换是不可能的，例如，当存在在数据分类变量。用于特征选择技术，该技术特别适合于最小二乘拟合，见逐步回归。

职能

特征选择

`fscchi2`	单因素功能使用卡方检验进行分类排名
`fscmrmr`	秩利用最小冗余最大相关性（MRMR）算法用于分类功能
`fscnca`	使用分类邻里成分分析的特征选择
`fsrftest`	单因素功能使用回归排名F-tests
`fsrnca`	使用回归邻里成分分析的特征选择
`fsulaplacian`	排名采用拉普拉斯得分监督学习功能
`plotPartialDependence`	创建局部依赖图（PDP）和个体条件期望（ICE）地块
`oobPermutedPredictorImportance`	预测变量重要性估计通过了球袋预测观测置换为分类树的随机森林
`oobPermutedPredictorImportance`	预测变量重要性估计通过了球袋预测观测排列为回归树的随机森林
`predictorImportance`	预测因子对分类树重要性的估计
`predictorImportance`	预测的重要性估计决策树分类集成
`predictorImportance`	回归树预测因子重要性的估计
`predictorImportance`	预测的重要性估计回归集成
`relieff`	使用ReliefF或RReliefF算法对预测因子的重要性进行排序
`sequentialfs`	使用自定义的标准顺序特征选择
`stepwiselm`	执行逐步回归
`stepwiseglm`	创建逐步回归广义线性回归模型

特征提取

`哥斯达黎加`	通过使用重建ICA特征提取
`sparsefilt`	利用稀疏滤波进行特征提取
`变换`	变换预测到提取的特征

t-SNE多维可视化

tsne 叔分布式随机邻居嵌入

PCA和典型相关

`barttest`	巴特利特的测试
`canoncorr`	典型相关
`PCA`	原始数据的主分量分析
`pcacov`	上的协方差矩阵的主成分分析
`pcares`	从主成分分析的残差
`PPCA`	概率主成分分析

因子分析

`factoran`	因子分析
`rotatefactors`	旋转因子载荷

非负矩阵分解

nnmf 非负矩阵分解

多维尺度

`cmdscale`	古典多维尺度
`泰姬陵`	马氏距离
`mdscale`	非经典多维尺度
`pdist`	观测对之间的两两距离
`squareform`	格式距离矩阵

普鲁克分析

普鲁克 普鲁克分析

对象

展开全部

特征选择

`FeatureSelectionNCAClassification`	特征选择用于使用邻里成分分析分类（NCA）
`FeatureSelectionNCARegression`	特征选择用于使用邻里成分分析回归（NCA）

特征提取

`ReconstructionICA`	由重建ICA特征提取
`SparseFiltering`	通过稀疏滤波特征提取

话题

特征选择

简介特征选择

了解特征选择算法和探索可供特征选择的功能。

顺序特征选择

本主题引入了顺序特征选择和提供了选择功能依次使用自定义标准和示例sequentialfs功能。

邻里成分分析（NCA）特征选择

邻域成分分析(NCA)是一种非参数的特征选择方法，其目标是最大化回归和分类算法的预测精度。

正规化判别分析分类

在不损害模型的预测能力去除预测做一个更强大和更简单的模型。

选择用于预测指标随机森林

选择拆分，预测使用交互测试算法随机森林。

特征提取

特征提取

特征提取是一组方法，从数据中提取高级别功能。

特征提取流程

此示例示出了用于从图像数据中的特征提取的完整的工作流程。

提取混合信号

这个例子说明如何使用哥斯达黎加解开混合的音频信号。

t-SNE多维可视化

T-SNE

叔SNE是用于通过非线性还原可视化高维数据，以两个或三个维度，同时保留原始数据的某些特征的方法。

可视化高维数据使用T-SNE

这个例子中示出了T-SNE如何产生高维数据的有用的低维嵌入。

tsne设置

该示例示出的各种效果tsne设置。

叔SNE输出功能

输出功能的说明和示例对叔SNE。

PCA和典型相关

主成分分析(PCA)

主成分分析通过用新的一套是原始变量的线性组合变量更换几个相关的变量减少了数据的维数。

美国分析城市生活质量使用PCA

执行加权主成分分析和解释结果。

因子分析

因子分析

因子分析是一种将模型与多元数据进行拟合的方法，用以估计被测变量与较少数量的未观察(潜在)因素之间的相互依赖性。

运用因素分析法分析股票价格

使用因素分析来调查同一行业内的公司是否经历了类似的每周股价变化。

对考试成绩进行因素分析

这个例子说明如何进行使用统计和机器学习工具箱™因素分析。

非负矩阵分解

非负矩阵分解

非负矩阵分解（NMF）是基于所述特征空间的低秩近似一个降维技术。

执行非负矩阵分解

使用乘法和交替最小二乘算法执行非负矩阵因式分解。

多维尺度

多维尺度

多维尺度，您可以直观近点如何彼此对多种距离或差异性指标，可以在小维数产生的数据的表示。

古典多维尺度

用cmdscale执行经典（公制）多维标度，也被称为主坐标分析。

古典多维尺度应用到非空间的距离

这个例子说明如何使用执行经典多维尺度cmdscale在统计和机器学习工具箱功能™。

非经典多维尺度

此示例示出了如何使用多维标度（MDS）的非经典形式的可视化不相似性数据。

非经典和非度量多维尺度

执行使用非经典多维尺度mdscale。

普鲁克分析

普鲁克分析

普鲁克分析使用最小化的最佳保形欧几里德变换相比标数据之间的位置中的差异。

比较手写形状使用普鲁克分析

使用普鲁克分析比较两个手写数字。

精选示例

选择功能划分为高维数据

选择分级高维数据的功能。更具体地，它示出了如何执行顺序特征选择，这是最流行的特征选择算法之一。它也展示了如何使用维持和交叉验证来评估所选择的功能的性能。

打开脚本

偏最小二乘回归和主成分回归

应用偏最小二乘回归(PLSR)和主成分回归(PCR)方法，讨论了两种方法的有效性。PLSR和PCR都是在预测变量数量较多的情况下对响应变量进行建模的方法，这些预测变量之间存在高度相关甚至共线关系。这两种方法都构造了新的预测变量，称为分量，作为原始预测变量的线性组合，但是它们构造这些分量的方式不同。PCR创造了解释预测变量中观察到的变化的成分，而完全不考虑反应变量。另一方面，PLSR确实考虑了响应变量，因此常常导致模型能够用更少的组件来适应响应变量。就其实际应用而言，这最终是否会转化为一个更节俭的模式，取决于具体情况。

打开脚本

拟合正交回归的主成分分析

使用主成分分析（PCA），以适应线性回归。PCA最小化从数据到拟合模型的垂直距离。这是所谓的正交回归或总最小二乘线性的情况下，并且是在适当的时候有预测和响应变量之间没有天然的区别，或者当所有的变量都与错误测量。这与通常的回归假设预测变量进行测量准确，并且仅响应变量具有错误分量。

打开生活的脚本

降维和特征提取

职能

特征选择

特征提取

t-SNE多维可视化

PCA和典型相关

因子分析

非负矩阵分解

多维尺度

普鲁克分析

对象

特征选择

特征提取

话题

特征选择

特征提取

t-SNE多维可视化

PCA和典型相关

因子分析

非负矩阵分解

多维尺度

普鲁克分析

精选示例

选择功能划分为高维数据

偏最小二乘回归和主成分回归

拟合正交回归的主成分分析

统计和机器学习工具箱文档

金宝app

掌握机器学习：有步骤，分步指南与MATLAB