主要内容

factoran

因子分析

描述

factoran计算极大似然估计(企业)的因子载荷矩阵Λ因子分析模型

x = μ + Λ f + e

在哪里x是一个矢量观测变量,μ是一个常数向量的手段,Λ是常数d——- - - - - -因子载荷矩阵,f是一个向量的独立,标准化的常见因素,然后呢e是一个向量的独立的特定因素。x,μ,e每个人都有长度df长度

另外,可以指定的因子分析模型

( x ) = Λ Λ T + Ψ

在哪里 Ψ = ( e ) 是一个d——- - - - - -d对角矩阵的具体差异。

的使用factoran和它的关系主成分分析,请参阅进行因子分析考试成绩

例子

λ= factoran (X,)返回因子载荷矩阵λ的数据矩阵X常见的因素。

例子

(λ,ψ)= factoran (X,)也回报最大似然估计的具体差异。

例子

(λ,ψ,T)= factoran (X,)还返回——- - - - - -旋转因子载荷矩阵T

例子

(λ,ψ,T,统计数据)= factoran (X,)还返回结构统计数据包含相关信息的零假设H0的共同因素

例子

(λ,ψ,T,统计数据,F)= factoran (X,)还收益预测的常见因素(因子得分)。

例子

___= factoran (X,,名称,值)修改模型适合使用一个或多个名称-值对参数和输出,输出参数在前面的语法。例如,您可以指定的X数据协方差矩阵。

例子

全部折叠

创建一些伪随机的原始数据。

rng默认的%的再现性n = 100;X1 = 5 + 3 *兰德(n, 1);%因子1X2 = 20 - 5 *兰德(n, 1);%因子2

创建6个数据向量的原始数据,并添加随机噪声。

日元= 2 * X1 + 3 * X2 + randn (n, 1);Y2 = 4 * X1 + X2 + 2 * randn (n, 1);Y3 = X1, X2 + 3 * randn (n, 1);Y4 = 2 * X1 + 4 * X2 + 4 * randn (n, 1);日元= 3 * (X1 + X2) + 5 * randn (n, 1);日元= X1 - X2/2 + 6 * randn (n, 1);

创建一个数据矩阵的数据向量。

X = [Y1、Y2、Y3、Y4日元,日元);

从这个数据中提取两个因素矩阵X使用factoran。显示输出。

m = 2;(λ,psi, T,统计,F] = factoran (X, m);disp(λ)
0.8666 0.4828 0.8688 -0.0998 -0.0131 -0.5412 0.2150 0.8458 0.7040 0.2678 -0.0806 -0.2883
disp (psi)
0.0159 0.2352 0.7070 0.2385 0.4327 0.9104
disp (T)
0.8728 0.4880 0.4880 -0.8728
disp(统计)
loglike: -0.0531教育部:4 chisq: 5.0335 p: 0.2839
disp (F (1:10)):
1.8845 -0.6568 -0.1714 -0.8113 -1.0534 2.0743 1.0390 -1.1784 0.4309 0.9907 -1.1823 0.6570 -0.2129 1.1898 -0.0844 -0.7421 0.5854 -1.1379 0.8279 -1.9624

查看数据的相关矩阵。

corrX =。柯尔(X)。
corrX =6×61.0000 0.7047 -0.2710 0.5947 0.7391 -0.2126 0.7047 1.0000 0.0203 0.1032 0.5876 0.0289 -0.2710 0.0203 1.0000 -0.4793 -0.1495 0.1450 0.5947 0.1032 -0.4793 1.0000 0.3752 -0.2134 0.7391 0.5876 -0.1495 0.3752 1.0000 -0.2030 -0.2126 0.0289 0.1450 -0.2134 -0.2030 1.0000

比较corrX返回相应的值factoran,λ*λ' +诊断接头(psi)

C0 =λ*λ' +诊断接头(psi)
C0 =6×61.0000 0.7047 -0.2726 0.5946 0.7394 -0.2091 0.7047 1.0000 0.0426 0.1023 0.5849 -0.0413 -0.2726 0.0426 1.0000 -0.4605 -0.1542 0.1571 0.5946 0.1023 -0.4605 1.0000 0.3779 -0.2611 0.7394 0.5849 -0.1542 0.3779 1.0000 -0.1340 -0.2091 -0.0413 0.1571 -0.2611 -0.1340 1.0000

factoran获得λψ密切对应的原始数据的相关矩阵。

不使用旋转查看结果。

(λ,psi, T,统计,F] = factoran (X, m,“旋转”,“没有”);disp(λ)
0.9920 0.0015 0.7096 0.5111 -0.2755 0.4659 0.6004 -0.6333 0.7452 0.1098 -0.2111 0.2123
disp (psi)
0.0159 0.2352 0.7070 0.2385 0.4327 0.9104
disp (T)
1 0 0 1
disp(统计)
loglike: -0.0531教育部:4 chisq: 5.0335 p: 0.2839
disp (F (1:10)):
1.3243 1.4929 -0.5456 0.6245 0.0928 -2.3246 0.3318 1.5356 0.8596 -0.6544 -0.7114 -1.1504 0.3947 -1.1424 -0.4358 0.6065 -0.0444 1.2789 -0.2350 2.1169

只使用的协方差矩阵计算因素X

X2 = X (X);[lambda2 psi2, T2, stats2] = factoran (X2, m,“Xtype”,协方差的,“脑袋”,n)
lambda2 =6×20.8666 0.4828 0.8688 -0.0998 -0.0131 -0.5412 0.2150 0.8458 0.7040 0.2678 -0.0806 -0.2883
psi2 =6×10.0159 0.2352 0.7070 0.2385 0.4327 0.9104
T2 =2×20.8728 0.4880 0.4880 -0.8728
stats2 =结构体字段:loglike: -0.0531教育部:4 chisq: 5.0335 p: 0.2839

结果与原始数据是一样的,除了factoran无法计算因子得分矩阵F协方差数据。

加载示例数据。

负载carbig

定义变量矩阵。

X =(加速度位移马力MPG重量);X = X(所有(~ isnan (X), 2),:);

使用最小均方误差估计因子载荷预测两个共同因素的因子分析。

(λ,Psi, T,统计,F] = factoran (X 2“分数”,“回归”);发票(T ' * T);%估计的相关矩阵F = =眼(2)λ*λ' +诊断接头(Psi);%估计相关矩阵λ*发票(T);%不旋转载荷F * T ';%不旋转因子得分

创建一个biplot两个因素。

biplot(λ,“线宽”2,“MarkerSize”,20)

图包含一个坐标轴对象。坐标轴对象包含组件1,ylabel组件2包含3线类型的对象。一个或多个行显示的值只使用标记

使用协方差估计因子载荷矩阵(或相关)。

(λ,Psi, T) = factoran (X (X), 2,“Xtype”,协方差的)
λ=5×2-0.2432 -0.8500 0.8773 0.3871 0.7618 0.5930 -0.7978 -0.2786 0.9692 0.2129
ψ=5×10.2184 0.0804 0.0680 0.2859 0.0152
T =2×20.9476 0.3195 0.3195 -0.9476

(你可以使用corrcoef (X)而不是X (X)创建的数据factoran)。虽然估计是相同的,使用原始数据的协方差矩阵,而不是阻止你请求成绩或显著性水平。

使用电子产品品牌旋转。

(λ,Psi, T,统计,F] = factoran (X 2“旋转”,的电子产品品牌,“权力”4);发票(T ' * T)% F的估计相关,不再眼睛(2)
ans =2×21.0000 -0.6391 -0.6391 1.0000
λ*发票(T ' * T *λ+诊断接头(Psi)X %估计的相关性
ans =5×51.0000 -0.5424 -0.6893 0.4309 -0.4167 -0.5424 1.0000 0.8979 -0.8078 0.9328 -0.6893 0.8979 1.0000 -0.7730 0.8647 0.4309 -0.8078 -0.7730 1.0000 -0.8326 -0.4167 0.9328 0.8647 -0.8326 1.0000

情节不旋转变量斜轴重叠。

invT =发票(T);Lambda0 =λ* invT;图()行([-invT (1, 1) invT(1, 1)南-invT (2, 1) invT (2, 1)]。[-invT (1、2) invT(1、2)南-invT (2, 2) invT (2, 2)),“颜色”,“r”,“线宽”,2)网格持有biplot (Lambda0“线宽”2,“MarkerSize”(20)包含不旋转的载荷因子1 ')ylabel (不旋转的载荷因子2》)

图包含一个坐标轴对象。坐标轴对象包含对不旋转因子载荷1,ylabel载荷不旋转因子2包含3线类型的对象。一个或多个行显示的值只使用标记

情节对斜轴旋转变量。

图()biplot(λ,“线宽”2,“MarkerSize”,20)

图包含一个坐标轴对象。坐标轴对象包含组件1,ylabel组件2包含3线类型的对象。一个或多个行显示的值只使用标记

输入参数

全部折叠

数据,指定为一个n——- - - - - -d矩阵,每一行是一个观察d变量。

数据类型:

数量的常见因素,指定为一个正整数。

例子:3

数据类型:

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:λ= factoran (X, m,‘开始’,10日,“分数”,“汤姆森”)指定使用的起点预测方法的具体差异10和汤森因子得分。

输入数据类型X,指定为逗号分隔两人组成的“Xtype”和下列之一:

  • “数据”- - - - - -X是原始数据。

  • 协方差的- - - - - -X是一个正定协方差或相关矩阵。

例子:“Xtype”、“协方差的

数据类型:字符|字符串

方法预测因子得分,指定为逗号分隔组成的“分数”和下列之一:

  • “wls”或同等“Bartlett”加权最小二乘估计治疗F作为固定

  • “回归”或同等“汤姆森”-最小均方误差预测,相当于一个岭回归

例子:“分数”、“回归”

数据类型:字符|字符串

起点的具体差异ψ在最大似然优化,指定为逗号分隔组成的“开始”和下列之一:

  • “Rsquared”——选择初始向量作为比例因子乘以诊断接头(发票(corrcoef (X)))(默认)。有关示例,请参见Joreskog[2]

  • “随机”——选择d均匀分布区间[0,1]上的值。

  • 正整数——执行给定数量的最大似然适合每个初始化一样“随机”factoran返回符合最高的可能性。

  • 矩阵d行——执行一个最大似然适合指定的矩阵的每一列。factoran初始化th优化值列。

例子:‘开始’,5

数据类型:|字符|字符串

方法用于旋转因子载荷和分数,指定为逗号分隔组成的“旋转”下表中的值。你可以控制的旋转通过指定额外的参数名称-值对rotatefactors功能,如表所示。有关详细信息,请参见rotatefactors

价值 描述

“没有”

执行没有旋转

“equamax”

特殊情况的“orthomax”旋转。使用“正常化”,“reltol”,“麦克斯特”参数来控制旋转的细节。

“orthomax”

正交旋转,最大化准则基于载荷的方差。使用多项式系数的,“正常化”,“reltol”,“麦克斯特”参数来控制旋转的细节。

“parsimax”

orthomax旋转的特殊情况。使用“正常化”,“reltol”,“麦克斯特”参数来控制旋转的细节。

“模式”

执行一个斜旋转(默认)或正交旋转矩阵最佳匹配指定的模式。使用“类型”参数选择旋转的类型。使用“目标”参数来指定模式矩阵。

“普罗克汝斯忒斯之

执行一个斜旋转(默认)或正交旋转最佳匹配指定的目标矩阵最小二乘意义上的。使用“类型”参数选择旋转的类型。使用“目标”参数指定目标矩阵。

的电子产品品牌

普罗克汝斯忒斯执行一个斜旋转目标矩阵所决定factoran作为一个orthomax解决方案的函数。使用“权力”参数来指定创建目标的指数矩阵。因为的电子产品品牌使用“orthomax”在内部,您还可以指定适用的参数“orthomax”

“quartimax”

特殊情况的“orthomax”旋转。使用“正常化”,“reltol”,“麦克斯特”参数来控制旋转的细节。

“最大方差法”

特殊情况的“orthomax”旋转(默认)。使用“正常化”,“reltol”,“麦克斯特”参数来控制旋转的细节。

函数处理

函数句柄旋转函数的形式

[B、T] = myrotation (A,…)

在哪里一个是一个d——- - - - - -不旋转因子载荷矩阵,B是一个d——- - - - - -旋转后的载荷矩阵,T是相应的——- - - - - -旋转矩阵。

使用factoran论点“UserArgs”将附加参数传递给这个旋转功能。看到用户定义的旋转功能

例子:(λ,psi, T) = factoran (X, m,“旋转”,“电子产品品牌”,“权力”,5,麦克斯特,100)

数据类型:字符|字符串|function_handle

下界的ψ最大似然参数期间优化,指定为逗号分隔组成的“δ”和一个标量值在0和1之间(0 <δ< 1)。

例子:0.02

数据类型:

最大似然优化选项,指定为逗号分隔两人组成的“OptimOpts”和创建的结构statset。您可以输入statset (“factoran”)选项列表中,也下表中描述。

字段名(statset论点) 意义 {默认值}
“显示”

数量的信息显示的算法

  • {‘off’}——显示任何信息

  • “最后一次”——显示最终的输出

  • “通路”——显示迭代输出的命令窗口函数;否则显示最终的输出

MaxFunEvals

允许的最大数量的目标函数评估

正整数,{400}
麦克斯特

允许的最大迭代数

正整数,{100}
TolFun

终止对目标函数的值。解算器停止当连续函数值小于TolFun分开。

积极的标量,{1 e-8}
TolX

终止对参数。解算器停止当连续参数值小于TolX分开。

积极的标量,{1 e-8}

例子:statset(“显示”、“iter”)

数据类型:结构体

数量的观察来评估X,指定为逗号分隔两人组成的“脑袋”和一个正整数。脑袋只适用于当Xtype协方差的。指定“脑袋”使您能够获得统计数据输出结构领域chisqp

例子:50

数据类型:

输出参数

全部折叠

因子载荷,作为一个返回d——- - - - - -矩阵。d数据矩阵的列数吗X,是第二个输入参数的factoran

(i, j)th元素λ是系数,或加载的jth因素变量。默认情况下,factoran调用函数rotatefactors估计因子载荷使用旋转“最大方差法”选择。旋转的信息,请参阅旋转因子载荷和分数

具体的差异,作为一个返回d——- - - - - -1向量。d数据矩阵的列数吗X。的条目ψ最大似然估计。

旋转因子载荷,作为一个返回——- - - - - -矩阵。是第二个输入参数的factoran。旋转的信息,请参阅旋转因子载荷和分数

信息的共同因素,作为一个结构返回。统计数据包含有关信息零假设H0的共同因素

统计数据包含以下字段。

描述
loglike

最大化loglikelihood价值

教育部

误差自由度=((d-m) ^ 2 - (d + m)) / 2

chisq

近似卡方统计量为零假设

p

右尾零假设的显著性水平

factoran不计算chisqp领域,除非教育部积极的和特定的方差估计在吗ψ是积极的(见海伍德案件)。如果X协方差矩阵和你想要的吗factoran计算chisqp字段,然后还必须指定“脑袋”名称-值对的论点。

因子得分,也称为预测的常见因素,作为一个返回n——- - - - - -矩阵。n数据矩阵的行数X,是第二个输入参数的factoran

请注意

如果X协方差矩阵(Xtype=协方差的),factoran无法计算F

factoran旋转F至于使用相同的标准λ。旋转的信息,请参阅旋转因子载荷和分数

更多关于

全部折叠

海伍德案件

如果元素ψ的值是相等的δ参数(也就是说,他们基本上是零),适合称为海伍德案,解释产生的估计是有问题的。具体来说,可以有多个局部极大值的可能性,每个都有不同的载荷和特定的方差的估计。海伍德案件可以表明过度拟合(太大),但也可以underfitting的结果。

旋转因子载荷和分数

除非你显式地指定没有轮换使用“旋转”名称-值对的论点,factoran旋转估计因子载荷λ和因子得分F。输出矩阵T用于旋转载荷,λ= lambda0 * T,在那里lambda0是初始载荷(不旋转)的程序。T是一个正交矩阵正交旋转,没有旋转的单位矩阵。的倒数T被称为“主坐标轴旋转矩阵,而T本身是相关参考轴旋转矩阵。正交旋转,两个是相同的。

factoran计算因子得分,旋转了发票(T '),也就是说,F = F0 *发票(T '),在那里F0包含不旋转预测。估计的协方差F发票(T ' * T)单位矩阵的正交旋转或没有。旋转因子载荷和分数是为了创建一个更容易理解的结构在载荷矩阵最大似然估计。

用户定义的旋转功能

附加参数传递给用户定义的语法旋转函数是:

(λ,Psi, T) =factoran (X, 2,“旋转”@myrotation,“UserArgs”,1“两个”);

引用

[1]哈曼,哈利贺拉斯。现代的因素分析。第三。芝加哥:芝加哥大学出版社,1976年。

[2]Joreskog, k . g .“一些贡献最大似然因素分析。”心理测量学32岁的没有。4(1967年12月):443 - 82。https://doi.org/10.1007/BF02289658

[3]·罗莉,d . N。,一个。E. Maxwell.因子分析的统计方法。第二版。纽约:美国爱思唯尔出版有限公司,1971年。

扩展功能

版本历史

之前介绍过的R2006a