双向方差分析- MATLAB和Simulink -金宝app MathWorks澳大利亚 - 金宝app,下载188bet金宝搏,金宝搏官方网站

双向方差分析

双向方差分析简介

你可以使用这个函数anova2进行平衡双向方差分析(ANOVA)。要对不平衡设计进行双向方差分析，请使用anovan．例如，请参见不平衡设计的双向方差分析．

与单因素方差分析一样，双向方差分析研究的数据可以是实验性的，也可以是观察性的。单向方差分析和双向方差分析的区别在于，在双向方差分析中，两个因素对响应变量的影响是有趣的。这两个因素可以是独立的，没有交互作用，或者一个因素对反应变量的影响取决于另一个因素的组(水平)。如果这两个因素没有相互作用，则该模型称为一个添加剂模型。

假设一家汽车公司有两个工厂，每个工厂生产相同的三种车型。汽车的耗油量因工厂和车型的不同而不同。这两个因素，工厂和车型，解释了里程数的差异，即反应。一个衡量利益的方法是工厂之间由于生产方法而产生的里程差异。另一个有趣的衡量标准是由于不同的设计规格，车型的里程差异(与工厂无关)。这些措施的效果是添加剂．另外，假设只有一款车型在不同工厂之间的油耗不同，而其他两款车型在不同工厂之间的油耗相同。这叫做交互效果．为了测量相互作用的效果，必须对工厂和汽车模型的某些组合进行多次观察。这些多重观察被称为复制．

双向方差分析是一种特殊情况线性模型．模型的双向方差分析形式为

$y_{我 j r} ＝ μ + α_{我} + β_{j} + {（ α β ）}_{我 j} + ε_{我 j r}$

在那里,

y_ijr是对响应变量的观察。
- 我代表集团我行因素一个，我= 1, 2，…我．
- j代表集团j列因素B，j= 1, 2，…J．
- r表示复制编号，r= 1, 2，…R．
总共有N＝我＊J＊R观察。
μ是总体平均值。
α_我组的偏差是由行因子定义的吗一个从总体平均值来看μ．的值α_我金额为0。

$\sum_{我＝ 1}^{我} α_{我} ＝ 0.$
β_j组的偏差是否由列因子定义B从总体平均值来看μ．的值β_j金额为0。

$\sum_{j ＝ 1}^{J} β_{j} ＝ 0.$
αβ_ij是相互作用的。的每行和每列中的值αβ_ij金额为0。

$\sum_{我＝ 1}^{我} {（ α β ）}_{我 j} ＝ \sum_{j ＝ 1}^{J} {（ α β ）}_{我 j} ＝ 0.$
ε_ijr为随机扰动。假设它们是独立的，正态分布的，并且有常数方差。

在里程的例子中:

y_ijr是对燃油里程的观察，μ就是总的平均油耗。
α_我每辆车的油耗与平均油耗的偏差是多少μ由于汽车的模型．
β_j每辆车的油耗与平均油耗的偏差是多少μ由于汽车的工厂．

anova2要求数据是平衡的，所以每个模型和工厂的组合必须有相同数量的汽车。

双向方差分析检验有关因素影响的假设一个和B，以及它们对响应变量的相互作用y．关于行因子组的平均响应相等的假设一个是

$\begin{array}{l} H_{0} ： α_{1} ＝ α_{2} \dots ＝ α_{我} \\ H_{1} ：至少有一个 α_{我} 是不同的，我＝ 1 ， 2 ， .．. ，我． \end{array}$

列因子组平均响应相等的假设B是

$\begin{array}{l} H_{0} ： β_{1} ＝ β_{2} ＝ \dots ＝ β_{J} \\ H_{1} ：至少有一个 β_{j} 是不同的, j ＝ 1 ， 2 ， .．. ， J ． \end{array}$

关于列因子和行因子相互作用的假设是

$\begin{array}{l} H_{0} ： {（ α β ）}_{我 j} ＝ 0 \\ H_{1} ：至少有一个 {（ α β ）}_{我 j} \neq 0 \end{array}$

为平衡的双向方差分析准备数据

使用均衡的双向方差分析anova2，则必须以特定的矩阵形式排列数据。矩阵的列必须对应于列因子的组，B．这些行必须对应于行因子的组，一个，每组因子组合的重复次数相同一个和B．

假设行因子一个有三组，列因子B有两组(级别)。还假设每个因素的组合一个和B有两次测量或观察(代表= 2）.然后，每组因子一个有六个观察和每组因素B四个观察。

$\begin{matrix} \begin{matrix} B ＝ 1 & B ＝ 2 \end{matrix} \\ ［ \begin{matrix} y_{111} & y_{121} \\ y_{112} & y_{122} \\ y_{211} & y_{221} \\ y_{212} & y_{222} \\ y_{311} & y_{321} \\ y_{312} & y_{322} \end{matrix} ］ \end{matrix} \begin{matrix} \begin{matrix} \begin{matrix} \end{matrix} ｝一个＝ 1 \\ \begin{matrix} \end{matrix} ｝一个＝ 2 \\ \begin{matrix} \end{matrix} ｝一个＝ 3. \end{matrix} \end{matrix}$

下标分别表示行、列和复制。例如,y₂₂₁对应第二组因素的测量值一个，第二组因素B，以及此组合的第一个复制。

执行双向方差分析

打开生活的脚本

这个例子展示了如何执行双向方差分析，以确定汽车模型和工厂对汽车的里程评级的影响。

加载并显示示例数据。

负载里程里程

里程=6×333.3000 34.5000 37.4000 33.4000 34.8000 36.8000 32.9000 33.8000 37.6000 32.6000 33.4000 36.6000 32.5000 33.7000 37.0000 33.0000 33.9000 36.7000

有三个汽车模型(列)和两个工厂(列)。数据有六列里程数，因为每个工厂为研究提供了每种车型的三辆汽车(即复制数是三辆)。来自第一个工厂的数据位于前三行，来自第二个工厂的数据位于后三行。

执行双向方差分析。返回统计的结构，统计数据，用于多重比较。

nmbcars = 3;%每个型号的汽车数量，即复制的数量[~, ~,统计]= anova2(里程,nmbcars);

图双向方差分析包含uicontrol类型的对象。

你可以使用F-统计数据，以做假设测试，以找出里程数是否相同的车型，工厂，和模型-工厂对。在执行这些测试之前，您必须根据附加效果进行调整。anova2返回p从这些测试中获取。

的p-模型效应值(列)是0到小数点后四位。这一结果是一个强有力的迹象表明，里程不同的一种模式到另一种。

的p-工厂效应的值(行)为0.0039，这也是非常显著的。这个数值表明一家工厂在生产汽车的油耗上优于另一家工厂。观察到的p-value表示指定一个F-与观察到的数据一样极端F如果每个工厂的汽油里程相等，那么1000次中有4次是偶然发生的。

工厂和模型似乎没有相互作用。的p-value, 0.8411，表示观测结果是可能的(100次中84次)，假设没有交互。

执行多重比较找出三种车型中哪对车型有显著差异。

c = multcompare(统计)

注意:您的模型包含一个交互术语。当模型包含交互作用时，主效应的测试可能很难解释。

图列的多重比较包含一个轴对象。标题轴对象单击你想要测试的组包含7个类型线对象。

c =3×61.0000 2.0000 -1.5865 -1.0667 -0.5469 0.0004 1.0000 3.0000 -4.5865 -4.0667 -3.5469 0.0000 2.0000 3.0000 -3.5198 -3.0000 -2.4802

在矩阵c，前两列显示了进行比较的汽车模型对。最后一列显示p测试的值。所有p-值较小(0.0004、0、0)，说明各车型的平均行驶里程差异较大。

图中蓝色条是第一款车型的平均里程比较区间。红色条是第二款和第三款车型的平均里程比较间隔。第2、3个比较区间与第1个比较区间没有重叠，说明第1个车型的平均里程与第2、3个车型的平均里程不相同。如果你点击另一个栏，你可以测试其他车型。比较间隔没有重叠，说明每款车的平均里程与其他两款车有显著差异。

数学细节

双因素方差分析将总变异分为以下几部分:

行因子组的变异均值从总体均值出发， ${\bar{y}}_{我．．} - {\bar{y}}_{.．.}$
列因子组的变异均值从总体均值出发， ${\bar{y}}_{． j ．} - {\bar{y}}_{.．.}$
总体均值的变异加上从列因子组均值加上行因子组均值的复制均值， ${\bar{y}}_{我 j ．} - {\bar{y}}_{我．．} - {\bar{y}}_{． j ．} + {\bar{y}}_{.．.}$
从复制观察到的变化意味着， $y_{我 j k} - {\bar{y}}_{我 j ．}$

方差分析将总平方和(SST)划分为由于行因子的平方和一个(SS_一个)，列因子的平方和B(SS_B)，由于相互作用的平方和一个和B(SS_AB)和平方和误差(SSE)。

$\begin{array}{l} \underset{年代年代 T}{\underset{︸}{\sum_{我＝ 1}^{米} \sum_{j ＝ 1}^{k} \sum_{r ＝ 1}^{R} {（ y_{我 j k} - {\bar{y}}_{.．.} ）}^{2}}} ＝ \underset{年代 {年代}_{B}}{\underset{︸}{k R \sum_{我＝ 1}^{米} {（ {\bar{y}}_{我．．} - {\bar{y}}_{.．.} ）}^{2}}} + \underset{年代 {年代}_{一个}}{\underset{︸}{米 R \sum_{j ＝ 1}^{k} {（ {\bar{y}}_{． j ．} - {\bar{y}}_{.．.} ）}^{2}}} \\ + \underset{年代 {年代}_{一个 B}}{\underset{︸}{R \sum_{我＝ 1}^{米} \sum_{j ＝ 1}^{k} {（ {\bar{y}}_{我 j ．} - {\bar{y}}_{我．．} - {\bar{y}}_{． j ．} + {\bar{y}}_{.．.} ）}^{2}}} + \underset{年代年代 E}{\underset{︸}{\sum_{我＝ 1}^{米} \sum_{j ＝ 1}^{k} \sum_{r ＝ 1}^{R} {（ y_{我 j k} - {\bar{y}}_{我 j ．} ）}^{2}}} \end{array}$

方差分析采用由于因素或交互作用而产生的变异，并将其与由于错误而产生的变异进行比较。如果两个变量的比例高，则该因子或交互效应的影响在统计上是显著的。您可以使用具有F分布。

对于零假设行因子组的平均响应一个，检验统计量是

$F ＝ \frac{\frac{年代 {年代}_{B}}{米 - 1}}{\frac{年代年代 E}{米 k （ R - 1 ）}} \sim F_{米 - 1 ，米 k （ R - 1 ）} ．$

对于零假设，列因子组的平均响应B，检验统计量是

$F ＝ \frac{\frac{年代 {年代}_{一个}}{k - 1}}{\frac{年代年代 E}{米 k （ R - 1 ）}} \sim F_{k - 1 ，米 k （ R - 1 ）} ．$

对于列因子和行因子的交互作用为零的零假设，检验统计量为

$F ＝ \frac{\frac{年代 {年代}_{一个 B}}{（米 - 1 ）（ k - 1 ）}}{\frac{年代年代 E}{米 k （ R - 1 ）}} \sim F_{（米 - 1 ）（ k - 1 ），米 k （ R - 1 ）} ．$

如果p价值的F-统计量小于显著性水平，则方差分析拒绝零假设。最常见的显著性水平为0.01和0.05。

方差分析表

方差分析表通过来源捕获模型中的可变性F-检验此变异的显著性的统计量，以及p-值，用于决定此可变性的重要性。的p返回的值anova2取决于对随机扰动的假设，ε_我j，模型方程中。为p-值要正确，这些扰动必须是独立的、正态分布的，并且具有常数方差。标准的方差分析表是这样的:

anova2返回标准的方差分析表作为有六列的单元格数组。

列	定义
`源`	变化的来源。
`党卫军`	每个源的平方和。
`df`	与每个源相关联的自由度。假设J是列因子中的组数，我行中有多少组，和R为重复次数。那么，观测的总次数为IJR总的自由度是IJR- 1。我- 1是行因子的自由度，J- 1为柱因子的自由度，(我- 1) (J- 1)是相互作用的自由度，和IJ（R- 1)为误差自由度。
`女士`	每个源的均方，也就是比值`SS / df`．
`F`	F-statistic，即均方比。
`概率F >`	的p-value，也就是F-statistic可以取一个大于计算的test-statistic值的值。`anova2`从CDF推导出这个概率F分布。

方差分析表的行显示了被来源划分的数据的可变性。

行(源)	定义
`列`	可变性由于柱因素
`行`	由于行因素的可变性
`交互`	可变性由于行和列因素的相互作用
`错误`	变异性由于每组数据与组均值之间的差异(变异性)在组)
`总计`	总变化