主要内容

主成分分析(PCA)

多元统计中固有的困难之一是可视化具有许多变量的数据的问题。这个函数情节显示两个变量之间关系的图形。的plot3而且冲浪命令显示不同的三维视图。但是当有三个以上的变量时,将它们之间的关系形象化就比较困难了。

幸运的是,在具有许多变量的数据集中,变量组经常一起移动。其中一个原因是,可能有多个变量在测量控制系统行为的相同驱动原则。在许多系统中,只有少数这样的驱动力。但是大量的测量工具使您能够测量数十个系统变量。当这种情况发生时,您可以利用这种冗余信息。您可以通过用一个新变量替换一组变量来简化问题。

主成分分析是实现这种简化的一种定量的严格方法。该方法生成一组新的变量,称为主成分.每个主成分都是原始变量的线性组合。所有主成分彼此正交,因此没有冗余信息。主成分作为一个整体构成了数据空间的正交基。

有无数种方法可以构造几列数据的正交基。主成分基有什么特别之处?

第一个主成分是空间中的一个轴。当您将每个观察结果投射到该轴上时,结果值将形成一个新变量。这个变量的方差是第一个轴的所有选项中最大的。

第二个主成分是空间中的另一个轴,垂直于第一个轴。在这个轴上投影观测结果会产生另一个新变量。这个变量的方差在第二个轴的所有可能选择中是最大的。

主成分的全部集合与原始变量集一样大。但是,前几个主成分的方差之和超过原始数据总方差的80%是很常见的。通过检查这些少数新变量的图表,研究人员通常会对产生原始数据的驱动力有更深入的了解。

你可以使用这个函数主成分分析求主成分。使用主成分分析,您需要有您想要分析的实际测量数据。但是,如果缺少实际数据,但有数据的样本协方差或相关矩阵,则仍然可以使用该函数pcacov执行主成分分析。参见参考页pcacov对其输入和输出的描述。

另请参阅

|||

相关的话题