你可以使用这个函数anova2
进行平衡双向方差分析(ANOVA)。要对不平衡设计进行双向方差分析,请使用anovan
.例如,请参见不平衡设计的双向方差分析.
与单因素方差分析一样,双向方差分析研究的数据可以是实验性的,也可以是观察性的。单向方差分析和双向方差分析的区别在于,在双向方差分析中,两个因素对响应变量的影响是有趣的。这两个因素可以是独立的,没有交互作用,或者一个因素对反应变量的影响取决于另一个因素的组(水平)。如果这两个因素没有相互作用,则该模型称为一个添加剂模型。
假设一家汽车公司有两个工厂,每个工厂生产相同的三种车型。汽车的耗油量因工厂和车型的不同而不同。这两个因素,工厂和车型,解释了里程数的差异,即反应。一个衡量利益的方法是工厂之间由于生产方法而产生的里程差异。另一个有趣的衡量标准是由于不同的设计规格,车型的里程差异(与工厂无关)。这些措施的效果是添加剂.另外,假设只有一款车型在不同工厂之间的油耗不同,而其他两款车型在不同工厂之间的油耗相同。这叫做交互效果.为了测量相互作用的效果,必须对工厂和汽车模型的某些组合进行多次观察。这些多重观察被称为复制.
双向方差分析是一种特殊情况线性模型.模型的双向方差分析形式为
在那里,
yijr是对响应变量的观察。
我代表集团我行因素一个,我= 1, 2,…我.
j代表集团j列因素B,j= 1, 2,…J.
r表示复制编号,r= 1, 2,…R.
总共有N=我*J*R观察。
μ是总体平均值。
α我组的偏差是由行因子定义的吗一个从总体平均值来看μ.的值α我金额为0。
βj组的偏差是否由列因子定义B从总体平均值来看μ.的值βj金额为0。
αβij是相互作用的。的每行和每列中的值αβij金额为0。
εijr为随机扰动。假设它们是独立的,正态分布的,并且有常数方差。
在里程的例子中:
yijr是对燃油里程的观察,μ就是总的平均油耗。
α我每辆车的油耗与平均油耗的偏差是多少μ由于汽车的模型.
βj每辆车的油耗与平均油耗的偏差是多少μ由于汽车的工厂.
anova2
要求数据是平衡的,所以每个模型和工厂的组合必须有相同数量的汽车。
双向方差分析检验有关因素影响的假设一个和B,以及它们对响应变量的相互作用y.关于行因子组的平均响应相等的假设一个是
列因子组平均响应相等的假设B是
关于列因子和行因子相互作用的假设是
使用均衡的双向方差分析anova2
,则必须以特定的矩阵形式排列数据。矩阵的列必须对应于列因子的组,B.这些行必须对应于行因子的组,一个,每组因子组合的重复次数相同一个和B.
假设行因子一个有三组,列因子B有两组(级别)。还假设每个因素的组合一个和B有两次测量或观察(代表= 2
).然后,每组因子一个有六个观察和每组因素B四个观察。
下标分别表示行、列和复制。例如,y221对应第二组因素的测量值一个,第二组因素B,以及此组合的第一个复制。
这个例子展示了如何执行双向方差分析,以确定汽车模型和工厂对汽车的里程评级的影响。
加载并显示示例数据。
负载里程里程
里程=6×333.3000 34.5000 37.4000 33.4000 34.8000 36.8000 32.9000 33.8000 37.6000 32.6000 33.4000 36.6000 32.5000 33.7000 37.0000 33.0000 33.9000 36.7000
有三个汽车模型(列)和两个工厂(列)。数据有六列里程数,因为每个工厂为研究提供了每种车型的三辆汽车(即复制数是三辆)。来自第一个工厂的数据位于前三行,来自第二个工厂的数据位于后三行。
执行双向方差分析。返回统计的结构,统计数据
,用于多重比较。
nmbcars = 3;%每个型号的汽车数量,即复制的数量[~, ~,统计]= anova2(里程,nmbcars);
你可以使用F-统计数据,以做假设测试,以找出里程数是否相同的车型,工厂,和模型-工厂对。在执行这些测试之前,您必须根据附加效果进行调整。anova2
返回p从这些测试中获取。
的p-模型效应值(列
)是0到小数点后四位。这一结果是一个强有力的迹象表明,里程不同的一种模式到另一种。
的p-工厂效应的值(行
)为0.0039,这也是非常显著的。这个数值表明一家工厂在生产汽车的油耗上优于另一家工厂。观察到的p-value表示指定一个F-与观察到的数据一样极端F如果每个工厂的汽油里程相等,那么1000次中有4次是偶然发生的。
工厂和模型似乎没有相互作用。的p-value, 0.8411,表示观测结果是可能的(100次中84次),假设没有交互。
执行多重比较找出三种车型中哪对车型有显著差异。
c = multcompare(统计)
注意:您的模型包含一个交互术语。当模型包含交互作用时,主效应的测试可能很难解释。
c =3×61.0000 2.0000 -1.5865 -1.0667 -0.5469 0.0004 1.0000 3.0000 -4.5865 -4.0667 -3.5469 0.0000 2.0000 3.0000 -3.5198 -3.0000 -2.4802
在矩阵c
,前两列显示了进行比较的汽车模型对。最后一列显示p测试的值。所有p-值较小(0.0004、0、0),说明各车型的平均行驶里程差异较大。
图中蓝色条是第一款车型的平均里程比较区间。红色条是第二款和第三款车型的平均里程比较间隔。第2、3个比较区间与第1个比较区间没有重叠,说明第1个车型的平均里程与第2、3个车型的平均里程不相同。如果你点击另一个栏,你可以测试其他车型。比较间隔没有重叠,说明每款车的平均里程与其他两款车有显著差异。
双因素方差分析将总变异分为以下几部分:
行因子组的变异均值从总体均值出发,
列因子组的变异均值从总体均值出发,
总体均值的变异加上从列因子组均值加上行因子组均值的复制均值,
从复制观察到的变化意味着,
方差分析将总平方和(SST)划分为由于行因子的平方和一个(SS一个),列因子的平方和B(SSB),由于相互作用的平方和一个和B(SSAB)和平方和误差(SSE)。
方差分析采用由于因素或交互作用而产生的变异,并将其与由于错误而产生的变异进行比较。如果两个变量的比例高,则该因子或交互效应的影响在统计上是显著的。您可以使用具有F分布。
对于零假设行因子组的平均响应一个,检验统计量是
对于零假设,列因子组的平均响应B,检验统计量是
对于列因子和行因子的交互作用为零的零假设,检验统计量为
如果p价值的F-统计量小于显著性水平,则方差分析拒绝零假设。最常见的显著性水平为0.01和0.05。
方差分析表通过来源捕获模型中的可变性F-检验此变异的显著性的统计量,以及p-值,用于决定此可变性的重要性。的p返回的值anova2
取决于对随机扰动的假设,ε我j,模型方程中。为p-值要正确,这些扰动必须是独立的、正态分布的,并且具有常数方差。标准的方差分析表是这样的:
anova2
返回标准的方差分析表作为有六列的单元格数组。
列 | 定义 |
---|---|
源 |
变化的来源。 |
党卫军 |
每个源的平方和。 |
df |
与每个源相关联的自由度。假设J是列因子中的组数,我行中有多少组,和R为重复次数。那么,观测的总次数为IJR总的自由度是IJR- 1。我- 1是行因子的自由度,J- 1为柱因子的自由度,(我- 1) (J- 1)是相互作用的自由度,和IJ(R- 1)为误差自由度。 |
女士 |
每个源的均方,也就是比值SS / df . |
F |
F-statistic,即均方比。 |
概率F > |
的p-value,也就是F-statistic可以取一个大于计算的test-statistic值的值。anova2 从CDF推导出这个概率F分布。 |
方差分析表的行显示了被来源划分的数据的可变性。
行(源) | 定义 |
---|---|
列 |
可变性由于柱因素 |
行 |
由于行因素的可变性 |
交互 |
可变性由于行和列因素的相互作用 |
错误 |
变异性由于每组数据与组均值之间的差异(变异性)在组) |
总计 |
总变化 |
吴昌芳,M. Hamada。实验:规划、分析和参数设计优化, 2000年。
Neter, J., M. H. Kutner, C. J. Nachtsheim, W. Wasserman.第四版。应用线性统计模型.欧文出版社,1996年。
anova1
|anova2
|anovan
|multcompare