主要内容

主成分分析(PCA)

多元统计中固有的困难之一是可视化数据多变量的问题。这个函数情节显示一个图的两个变量之间的关系。的plot3冲浪命令显示不同的三维视图。但有超过三个变量时,它更难以想象他们的关系。

幸运的是,与许多变量,数据集组变量经常在一起移动。一个原因是多个变量可能是测量同一驾驶原则管理系统的行为。在许多系统中只有少数这样的驱动力。但是大量的仪器可以测量几十个系统变量。,当这一切发生的时候,你可以利用冗余的信息。可以简化问题,更换一组变量用一个新变量。

主成分分析是一种定量的方法实现这一简化。该方法生成一个新的变量,调用主成分。每个主成分都是原始变量的线性组合。所有的主要组件是正交的,所以不存在冗余信息。主成分作为一个整体,形成一个正交的基础空间数据。

有无限的方法来构造正交基几个列的数据。主成分的基础上有什么特别之处?

第一主成分是单轴在空间。项目的每个观察轴时,结果形成一个新变量值。这个变量的方差是第一轴的最大之间所有可能的选择。

第二主成分是另一个空间轴,垂直于第一。突出的观察这个轴产生另一个新变量。此变量的方差的最大第二轴之间所有可能的选择。

主要组件是一样大的全套原设置的变量。但这是司空见惯的前几个主成分的方差之和超过原始数据的总方差的80%。通过检查的这几个新变量,研究人员通常开发一个更深的理解的驱动力,生成的原始数据。

您可以使用函数主成分分析找到主成分。使用主成分分析,你需要有你想要的实际测量数据分析。然而,如果你缺乏实际数据,但样本协方差或数据的相关矩阵,你仍然可以使用的函数pcacov进行主成分分析。看到页面的引用pcacov一个描述的输入和输出。

另请参阅

|||

相关的话题