使用因子分析分析股票价格

这个例子展示了如何分析如果公司在同一行业经验类似周而复始的股票价格的变化。

因子载荷

加载示例数据。

负载stockreturns

假设在100周,股票价格的变化百分比十公司已被记录。十家企业,第一可以分为四个主要技术,接下来的三个金融,最后三个零售。它似乎是合理的,公司的股票价格在同一部门可能会变化随着经济状况的变化。因子分析可以提供定量的证据。

第一个指定模型符合三种常见的因素。默认情况下,factoran计算旋转载荷的估计,试图让他们的简单解释。但在这个例子中,指定一个不旋转的解决方案。

(载荷、specificVar T统计)= factoran(股票、3、“旋转”,“没有”);

前两个factoran输出参数估计载荷和估计的具体差异。载荷矩阵的每一行表示一个十股,和每一列对应一个常见因素。与不旋转的估计,这个适合解释的因素是困难的,因为大多数的股票包含两个或两个以上的因素相当大的系数。

载荷

载荷=10×30.8885 0.2367 -0.2354 0.7126 0.3862 0.0034 0.3351 0.2784 -0.0211 0.3088 0.1113 -0.1905 0.6277 -0.6643 0.1478 0.4726 -0.6383 0.0133 0.1133 -0.5416 0.0322 0.6403 0.1669 0.4960 0.2363 0.5293 0.5770 0.1105 0.1680 0.5524

因子旋转有助于简化结构载荷矩阵,使它更容易分配的因素有意义的解释。

从估计的具体差异,你可以看到,该模型表明,特定股票价格变化以外的很多变化由于共同的因素。显示估计具体的差异。

specificVar

specificVar =10×10.0991 0.3431 0.8097 0.8559 0.1429 0.3691 0.6928 0.3162 0.3311 0.6544

特定的方差1表明没有公因数组件的变量,而特定的方差为0将表明,变量是完全由共同的因素决定的。这些数据似乎介于两者之间。

显示p价值。

stats.p

ans = 0.8144

的p值返回的统计数据结构不能拒绝零假设的三种常见的因素,表明这个模型提供了一个令人满意的解释这些数据的共变。

适合一个模型与两个常见因素是否少于三个因素可以提供一个可接受的健康。

[Loadings2 specificVar2, T2, stats2] = factoran(股票、2、“旋转”,“没有”);

显示p价值。

stats2.p

ans = 3.5610 e-06

的p为第二种配合是非常重要的价值,反对两个因素的假设,表明简单模型不足以解释这些数据中的模式。

因子旋转

结果说明,估计不旋转因子分析的载荷可以有一个复杂的结构。因子旋转的目标是找到一个参数化的每个变量只有少量的大载荷。即每个变量影响一小部分因素,最好只有一个。这通常可以更容易解释的因素代表什么。

如果你认为载荷矩阵的每一行作为m维空间中的一个点的坐标,然后每个因素都对应于一个坐标轴。因子旋转相当于这些轴旋转,计算新的载荷在旋转坐标系。有很多种方法可以做到这一点。一些方法把轴正交的,而另一些则斜方法改变它们之间的角度。对于这个示例,您可以通过使用旋转载荷估计电子产品品牌标准,一个常见的斜方法。

[LoadingsPM, specVarPM] = factoran(股票,3,“旋转”,的电子产品品牌);LoadingsPM

LoadingsPM =10×30.9452 0.1214 -0.0617 0.7064 -0.0178 0.2058 0.3885 -0.0994 0.0975 0.4162 -0.0148 -0.1298 0.1021 0.9019 0.0768 0.0873 0.7709 -0.0821 -0.1616 0.5320 -0.0888 0.2169 0.2844 0.6635 0.0016 -0.1881 0.7849 -0.2289 0.0636 0.6475

电子产品品牌创建了一个简单的旋转结构载荷,在大部分的股票有很大的加载在只有一个因素。更清楚地看到这个结构,您可以使用biplot函数绘制每个股票使用因子载荷的坐标。

biplot (LoadingsPM“varlabels”num2str ((1:10) '));轴广场视图(155年,27);

图包含一个坐标轴对象。坐标轴对象包含组件1,ylabel组件2包含13线类型的对象,文本。一个或多个行显示的值只使用标记

这情节显示电子产品品牌有旋转因子载荷更简单的结构。每个股票主要取决于只有一个因素,它可以描述每个因素的影响的股票。基于公司附近,轴,可以合理地得出这样的结论:第一个因子轴代表了金融部门,第二个零售,第三个技术。最初的猜想,股市变化主要在部门内,显然是支持的数据。金宝app

因子得分

有时是有用的能够分类一个观察基于其因素分数。举例来说,如果您接受了三因子模型和旋转因子的解释,您可能想要分类每周的有利的三种股票行业,基于10的数据观察股票。在这个例子中,因为数据是原始的股票价格变化,而不仅仅是他们的相关矩阵,可以有factoran回归估计的价值的三个旋转每周的常见因素。你可以画出估计分数,看看在每周不同的证券行业受到影响。

[LoadingsPM, specVarPM, TPM,统计,F] = factoran(股票,3,“旋转”,的电子产品品牌);plot3 (F (: 1) F (:, 2), F (:, 3),“b”。)线([4 4南0 0南0 0],[0 0南南4 4 0 0],[0 0南0 0南4 4],“颜色”,“黑”)包含(金融行业的)ylabel (“零售业”)zlabel (技术部门的网格)在轴广场视图(-22.5,8)

图包含一个坐标轴对象。坐标轴对象包含金融部门,ylabel零售业包含2线类型的对象。一个或多个行显示的值只使用标记

斜旋转经常创建相关的因素。这图显示了一些相关性的证据第一和第三个因素,你可以进一步调查通过计算相关矩阵估计的因素。

发票(TPM的* TPM);

可视化的结果

您可以使用biplot函数来帮助可视化因子载荷为每个变量和因子得分为每个观察在一个阴谋。例如,下面的命令块的结果因素分析股票数据和标签上的每个10股。

biplot (LoadingsPM“分数”F“varlabels”num2str((1:10)))包含(金融行业的)ylabel (“零售业”)zlabel (技术部门的)轴广场视图(155年,27)

图包含一个坐标轴对象。坐标轴对象包含金融部门,ylabel零售业包含14线类型的对象,文本。一个或多个行显示的值只使用标记

在这种情况下,因素分析包括三个因素,所以biplot是三维的。每个10只股票在这个阴谋的代表是一个矢量,方向和长度的向量表示每个股票如何取决于潜在的因素。例如,您已经看到电子产品品牌旋转后,前四个股市第一因素,积极的载荷和无关紧要的载荷在另两个因素。第一个因素,解释为金融行业的影响,表示在这个biplot的水平轴。这四个股票的依赖因素对应于四个向量直接沿轴约。同样,股票的依赖5、6和7主要在第二个因素,解释为零售业的影响,是由沿轴向量直接约。

的100个观察在这个阴谋,一个点,表示及其位置显示每个观测的得分三个因素。例如,点顶部附近的情节为科技行业因素得分最高。单元内的点缩放以适合广场,所以只有他们的相对位置可以确定的阴谋。

您可以使用数据指针工具的工具菜单的图窗口确定项目在这个阴谋。通过点击一个股票(向量),你可以读出股票为每个因子的载荷。通过点击一个观察(点),你可以读出,观察每个因素的分数。