主要内容

双向方差分析

双向方差分析简介

你可以使用这个函数anova2进行平衡双向方差分析(ANOVA)。要对不平衡设计进行双向方差分析,请使用anovan.例如,请参见不平衡设计的双向方差分析

与单因素方差分析一样,双向方差分析研究的数据可以是实验性的,也可以是观察性的。单向方差分析和双向方差分析的区别在于,在双向方差分析中,两个因素对响应变量的影响是有趣的。这两个因素可以是独立的,没有交互作用,或者一个因素对反应变量的影响取决于另一个因素的组(水平)。如果这两个因素没有相互作用,则该模型称为一个添加剂模型。

假设一家汽车公司有两个工厂,每个工厂生产相同的三种车型。汽车的耗油量因工厂和车型的不同而不同。这两个因素,工厂和车型,解释了里程数的差异,即反应。一个衡量利益的方法是工厂之间由于生产方法而产生的里程差异。另一个有趣的衡量标准是由于不同的设计规格,车型的里程差异(与工厂无关)。这些措施的效果是添加剂.另外,假设只有一款车型在不同工厂之间的油耗不同,而其他两款车型在不同工厂之间的油耗相同。这叫做交互效果.为了测量相互作用的效果,必须对工厂和汽车模型的某些组合进行多次观察。这些多重观察被称为复制

双向方差分析是一种特殊情况线性模型.模型的双向方差分析形式为

y j r μ + α + β j + α β j + ε j r

在那里,

  • yijr是对响应变量的观察。

    • 代表集团行因素一个= 1, 2,…

    • j代表集团j列因素Bj= 1, 2,…J

    • r表示复制编号,r= 1, 2,…R

    总共有NJR观察。

  • μ是总体平均值。

  • α组的偏差是由行因子定义的吗一个从总体平均值来看μ.的值α金额为0。

    1 α 0.

  • βj组的偏差是否由列因子定义B从总体平均值来看μ.的值βj金额为0。

    j 1 J β j 0.

  • αβij是相互作用的。的每行和每列中的值αβij金额为0。

    1 α β j j 1 J α β j 0.

  • εijr为随机扰动。假设它们是独立的,正态分布的,并且有常数方差。

在里程的例子中:

  • yijr是对燃油里程的观察,μ就是总的平均油耗。

  • α每辆车的油耗与平均油耗的偏差是多少μ由于汽车的模型

  • βj每辆车的油耗与平均油耗的偏差是多少μ由于汽车的工厂

anova2要求数据是平衡的,所以每个模型和工厂的组合必须有相同数量的汽车。

双向方差分析检验有关因素影响的假设一个B,以及它们对响应变量的相互作用y.关于行因子组的平均响应相等的假设一个

H 0 α 1 α 2 α H 1 至少有一个 α 是不同的 1 2 ...

列因子组平均响应相等的假设B

H 0 β 1 β 2 β J H 1 至少有一个 β j 是不同的, j 1 2 ... J

关于列因子和行因子相互作用的假设是

H 0 α β j 0 H 1 至少有一个 α β j 0

为平衡的双向方差分析准备数据

使用均衡的双向方差分析anova2,则必须以特定的矩阵形式排列数据。矩阵的列必须对应于列因子的组,B.这些行必须对应于行因子的组,一个,每组因子组合的重复次数相同一个B

假设行因子一个有三组,列因子B有两组(级别)。还假设每个因素的组合一个B有两次测量或观察(代表= 2).然后,每组因子一个有六个观察和每组因素B四个观察。

B 1 B 2 y 111 y 121 y 112 y 122 y 211 y 221 y 212 y 222 y 311 y 321 y 312 y 322 一个 1 一个 2 一个 3.

下标分别表示行、列和复制。例如,y221对应第二组因素的测量值一个,第二组因素B,以及此组合的第一个复制。

执行双向方差分析

这个例子展示了如何执行双向方差分析,以确定汽车模型和工厂对汽车的里程评级的影响。

加载并显示示例数据。

负载里程里程
里程=6×333.3000 34.5000 37.4000 33.4000 34.8000 36.8000 32.9000 33.8000 37.6000 32.6000 33.4000 36.6000 32.5000 33.7000 37.0000 33.0000 33.9000 36.7000

有三个汽车模型(列)和两个工厂(列)。数据有六列里程数,因为每个工厂为研究提供了每种车型的三辆汽车(即复制数是三辆)。来自第一个工厂的数据位于前三行,来自第二个工厂的数据位于后三行。

执行双向方差分析。返回统计的结构,统计数据,用于多重比较。

nmbcars = 3;%每个型号的汽车数量,即复制的数量[~, ~,统计]= anova2(里程,nmbcars);

图双向方差分析包含uicontrol类型的对象。

你可以使用F-统计数据,以做假设测试,以找出里程数是否相同的车型,工厂,和模型-工厂对。在执行这些测试之前,您必须根据附加效果进行调整。anova2返回p从这些测试中获取。

p-模型效应值()是0到小数点后四位。这一结果是一个强有力的迹象表明,里程不同的一种模式到另一种。

p-工厂效应的值()为0.0039,这也是非常显著的。这个数值表明一家工厂在生产汽车的油耗上优于另一家工厂。观察到的p-value表示指定一个F-与观察到的数据一样极端F如果每个工厂的汽油里程相等,那么1000次中有4次是偶然发生的。

工厂和模型似乎没有相互作用。的p-value, 0.8411,表示观测结果是可能的(100次中84次),假设没有交互。

执行多重比较找出三种车型中哪对车型有显著差异。

c = multcompare(统计)
注意:您的模型包含一个交互术语。当模型包含交互作用时,主效应的测试可能很难解释。

图列的多重比较包含一个轴对象。标题轴对象单击你想要测试的组包含7个类型线对象。

c =3×61.0000 2.0000 -1.5865 -1.0667 -0.5469 0.0004 1.0000 3.0000 -4.5865 -4.0667 -3.5469 0.0000 2.0000 3.0000 -3.5198 -3.0000 -2.4802

在矩阵c,前两列显示了进行比较的汽车模型对。最后一列显示p测试的值。所有p-值较小(0.0004、0、0),说明各车型的平均行驶里程差异较大。

图中蓝色条是第一款车型的平均里程比较区间。红色条是第二款和第三款车型的平均里程比较间隔。第2、3个比较区间与第1个比较区间没有重叠,说明第1个车型的平均里程与第2、3个车型的平均里程不相同。如果你点击另一个栏,你可以测试其他车型。比较间隔没有重叠,说明每款车的平均里程与其他两款车有显著差异。

数学细节

双因素方差分析将总变异分为以下几部分:

  • 行因子组的变异均值从总体均值出发, y ¯ .. y ¯ ...

  • 列因子组的变异均值从总体均值出发, y ¯ j y ¯ ...

  • 总体均值的变异加上从列因子组均值加上行因子组均值的复制均值, y ¯ j y ¯ .. y ¯ j + y ¯ ...

  • 从复制观察到的变化意味着, y j k y ¯ j

方差分析将总平方和(SST)划分为由于行因子的平方和一个(SS一个),列因子的平方和B(SSB),由于相互作用的平方和一个B(SSAB)和平方和误差(SSE)。

1 j 1 k r 1 R y j k y ¯ ... 2 年代 年代 T k R 1 y ¯ .. y ¯ ... 2 年代 年代 B + R j 1 k y ¯ j y ¯ ... 2 年代 年代 一个 + R 1 j 1 k y ¯ j y ¯ .. y ¯ j + y ¯ ... 2 年代 年代 一个 B + 1 j 1 k r 1 R y j k y ¯ j 2 年代 年代 E

方差分析采用由于因素或交互作用而产生的变异,并将其与由于错误而产生的变异进行比较。如果两个变量的比例高,则该因子或交互效应的影响在统计上是显著的。您可以使用具有F分布。

对于零假设行因子组的平均响应一个,检验统计量是

F 年代 年代 B 1 年代 年代 E k R 1 F 1 k R 1

对于零假设,列因子组的平均响应B,检验统计量是

F 年代 年代 一个 k 1 年代 年代 E k R 1 F k 1 k R 1

对于列因子和行因子的交互作用为零的零假设,检验统计量为

F 年代 年代 一个 B 1 k 1 年代 年代 E k R 1 F 1 k 1 k R 1

如果p价值的F-统计量小于显著性水平,则方差分析拒绝零假设。最常见的显著性水平为0.01和0.05。

方差分析表

方差分析表通过来源捕获模型中的可变性F-检验此变异的显著性的统计量,以及p-值,用于决定此可变性的重要性。的p返回的值anova2取决于对随机扰动的假设,εj,模型方程中。为p-值要正确,这些扰动必须是独立的、正态分布的,并且具有常数方差。标准的方差分析表是这样的:

anova2返回标准的方差分析表作为有六列的单元格数组。

定义
变化的来源。
党卫军 每个源的平方和。
df 与每个源相关联的自由度。假设J是列因子中的组数,行中有多少组,和R为重复次数。那么,观测的总次数为IJR总的自由度是IJR- 1。- 1是行因子的自由度,J- 1为柱因子的自由度,(- 1) (J- 1)是相互作用的自由度,和IJR- 1)为误差自由度。
女士 每个源的均方,也就是比值SS / df
F F-statistic,即均方比。
概率F > p-value,也就是F-statistic可以取一个大于计算的test-statistic值的值。anova2从CDF推导出这个概率F分布。

方差分析表的行显示了被来源划分的数据的可变性。

行(源) 定义
可变性由于柱因素
由于行因素的可变性
交互 可变性由于行和列因素的相互作用
错误 变异性由于每组数据与组均值之间的差异(变异性)组)
总计 总变化

参考文献

吴昌芳,M. Hamada。实验:规划、分析和参数设计优化, 2000年。

Neter, J., M. H. Kutner, C. J. Nachtsheim, W. Wasserman.第四版。应用线性统计模型.欧文出版社,1996年。

另请参阅

|||

相关的例子

更多关于