pca()文档说原始数据自动集中在过程的开始。如果为真,那么pca(X)应该等于pca(Y),其中Y =居中数据。但它们不是(具体数据如下)。此外,当我使用eig()或svd()来计算主成分时,我只能在使用pca()之前手动居中数据时得到它们来匹配主成分输出。归根结底,我的问题只是如何正确计算原始数据的主要成分?即,我是否需要手动居中和缩放它首先?只有手动中心吗?只有手动规模?
样本数据:X =
1.0000 -3.0000 -1.0000;2.0000 -2.0000 -0.5000;3.0000 -0.5000 0.2500;4.0000 2.0000 1.0000;5.0000 5.0000 2.5000;
定心X -> Y= -2.000 -3.3000 -1.4500;-1.0000 -2.3000 -0.9500;0 -0.8000 - -0.2000;1.0000 1.7000 0.5500;2.0000 4.7000 2.0500;
pca(X) = -0.7360 -0.6037 -0.3062;-0.6688 0.7186 0.1907;-0.1049 -0.3452 0.9327;
pca (Y) =
0.4058 0.8414 0.3569
0.9124 -0.3960 -0.1036
0.0542 0.3676 -0.9284
svd(Y) = 0.4058 0.9124 0.0542;0.8414 -0.3960 0.3676;0.3569 -0.1036 -0.9284;
eig(cov(Y)) = 0.0542 0.9124 0.4058;0.3676 -0.3960 0.8414;-0.9284 -0.1036 0.3569;这是相同的输出,只是顺序不同。