双向方差分析- MATLAB和Simulink M金宝appathWorks联合王国 - 金宝app,下载188bet金宝搏,金宝搏官方网站

双向方差分析

介绍双向方差分析

您可以使用函数anova2执行一个平衡双向方差分析(方差分析)。执行双向方差分析的不平衡设计,使用anovan。例如,看到的不平衡设计双向方差分析。

在单向方差分析,双向方差分析的数据可以实验或观察性研究。单向和双向方差分析之间的区别是,在双向方差分析,两个因素对响应变量的影响。这两个因素可以是独立的,没有相互影响,或一个因素的影响在响应变量可以依赖于组(水平)的另一个因素。如果这两个因素没有交互,称为一个模型添加剂模型。

假设一个汽车公司有两个工厂,每个工厂生产相同的三个车型。汽车的油耗可以改变从工厂到工厂,从模型到模型。这两个因素,工厂和模型,解释里程的差异,也就是说,响应。一个测量感兴趣的里程的差异是由于工厂之间的生产方法。感兴趣的另一个措施是不同的模型的里程(不论工厂)由于不同的设计规范。这些措施的影响感兴趣的添加剂。此外,假设只有一个模型不同工厂之间的油耗,而其他两个模型的里程是同一间工厂。这叫做一个交互效果。衡量一个交互效应,必须有多个观察一些工厂和汽车模型。这些多观察复制。

双向方差分析的一个特例线性模型。双向方差分析模型的形式

$y_{我 j r} = μ + α_{我} + β_{j} + {(α β)}_{我 j} + ε_{我 j r}$

在那里,

y_ijr是一个响应变量的观察。
- 我代表集团我行因素一个,我= 1,2,…,我。
- j代表集团j列因素B,j= 1,2,…,J。
- r代表了复制号码,r= 1,2,…,R。
有总N=我*J*R观察。
μ是整体的意思。
α_我行定义的偏差的因素吗一个从总体的意思是μ。的值α_我金额为0。

$\sum_{我 = 1}^{我} α_{我} = 0。$
β_j列定义的偏差的因素吗B从总体的意思是μ。的值β_j金额为0。

$\sum_{j = 1}^{J} β_{j} = 0。$
αβ_ij是相互作用的。在每一行和每一列的值αβ_ij金额为0。

$\sum_{我 = 1}^{我} {(α β)}_{我 j} = \sum_{j = 1}^{J} {(α β)}_{我 j} = 0。$
ε_ijr是随机扰动。他们认为是独立的,正态分布,方差不变。

里程的例子:

y_ijr油耗的观察,μ是整体的平均油耗。
α_我是每个汽车排放的尾气的偏差从油耗意味着什么μ由于汽车的模型。
β_j是每个汽车排放的尾气的偏差从油耗意味着什么μ由于汽车的工厂。

anova2要求数据平衡,所以每个组合模型和工厂必须有相同数量的汽车。

双向方差分析测试假设的影响因素一个和B和他们的相互作用对响应变量y。关于平等的假设组行平均响应的因素一个是

$\begin{array}{l} H_{0} : α_{1} = α_{2} \dots = α_{我} \\ H_{1} : 至少有一个 α_{我} 是不同的, 我 = 1, 2, …, 我。 \end{array}$

关于平等的假设组列平均响应的因素B是

$\begin{array}{l} H_{0} : β_{1} = β_{2} = \dots = β_{J} \\ H_{1} : 至少有一个 β_{j} 是不同的, j = 1, 2, …, J 。 \end{array}$

假设的列和行因素的相互作用

$\begin{array}{l} H_{0} : {(α β)}_{我 j} = 0 \\ H_{1} : 至少有一个 {(α β)}_{我 j} \neq 0 \end{array}$

为平衡双向方差分析准备数据

执行平衡双向方差分析使用anova2数据,您必须安排在一个特定的矩阵形式。矩阵的列必须对应组的列因素,B。行必须对应组行因素,一个与相同数量的复制,每个组的组合因素一个和B。

假设行因素一个有三个组,和列因素呢B有两个组(水平)。还假设每个因素的组合一个和B有两个测量或观察(代表= 2)。然后,每组的因素一个每组有六个观察和因素呢B四个观察。

$\begin{matrix} \begin{matrix} B = 1 & B = 2 \end{matrix} \\ (\begin{matrix} y_{111年} & y_{121年} \\ y_{112年} & y_{122年} \\ y_{211年} & y_{221年} \\ y_{212年} & y_{222年} \\ y_{311年} & y_{321年} \\ y_{312年} & y_{322年} \end{matrix}] \end{matrix} \begin{matrix} \begin{matrix} \begin{matrix} \end{matrix}} 一个 = 1 \\ \begin{matrix} \end{matrix}} 一个 = 2 \\ \begin{matrix} \end{matrix}} 一个 = 3 \end{matrix} \end{matrix}$

下标表示行,列,分别和复制。例如,y_221年对应于第二组的测量因素一个,第二组的因素B这个组合,第一次复制。

执行双向方差分析

打开生活的脚本

这个例子展示了如何执行双向方差分析确定车型和工厂对汽车的里程评级。

加载和显示样例数据。

负载里程里程

里程=6×333.3000 34.5000 37.4000 33.4000 34.8000 36.8000 32.9000 33.8000 37.6000 32.6000 33.4000 36.6000 32.5000 33.7000 37.0000 33.0000 33.9000 36.7000

有三种车型(列)和两个工厂(行)。提供的数据有六个里程行因为每个工厂的三辆车(即每个模型研究。,复制号码是三个)。从第一个工厂的数据是在前三行,和数据从第二工厂在最后三行。

执行双向方差分析。返回的结构数据,统计数据,用在多个比较。

nmbcars = 3;%的汽车数量从每个模型,即。、复制的数量[~,~,统计]= anova2(里程,nmbcars);

图双向方差分析包含类型的对象uicontrol。

您可以使用F统计假设测试找出如果里程是相同的模型,工厂,工厂模型——对。在执行这些测试之前,您必须调整添加剂的影响。anova2返回p从这些测试值。

的p价值模型的效果(列)是0到4位小数。这结果是一个强烈的迹象表明里程变化从一个模式到另一个地方。

的p工厂的价值效应(行)是0.0039,这也是非常重要的。这个值表明,一个工厂是远超其他油耗的汽车生产。观察到的p值表明一个F统计观察到极端F偶然发生大约4 1000倍,如果汽油里程数真正平等从工厂到工厂。

工厂和模型似乎没有互动。的p值,0.8411,意味着观测结果很可能(84的100倍),鉴于没有互动。

执行多重比较找出这两三个车型是明显不同的。

c = multcompare(统计)

注意:您的模型包括一个交互项。测试主要影响很难解释当模型包括交互。

图列意味着包含一个坐标轴对象的多重比较。坐标轴对象与标题点击您想要测试包含7线类型的对象。

c =3×61.0000 2.0000 -1.5865 -1.0667 -0.5469 0.0004 1.0000 3.0000 -4.5865 -4.0667 -3.5469 0.0000 2.0000 3.0000 -3.5198 -3.0000 -2.4802 0.0000

在矩阵c前两列显示,对汽车模型进行了比较。最后一列显示了p值的测试。所有p值很小(0.0004,0,0),这表明所有车型的平均里程明显不同。

在图中,蓝色的酒吧比较区间的平均里程第一辆车模型。红酒吧是均值的比较的间隔里程第二和第三的汽车模型。没有第二个和第三个比较区间重叠与第一比较区间,表明平均里程的第一辆车模型不同于第二和第三的平均里程汽车模型。如果你点击另一个酒吧,您可以测试其他车型。没有一个比较区间重叠,表明每辆车的平均里程模型是显著不同于其他两个。

数学细节

双因素方差分析分区总变异分为以下组件:

行因素组的变化意味着从总体的意思是, ${\bar{y}}_{我。。} - {\bar{y}}_{…}$
列因素组的变化意味着从总体的意思是, ${\bar{y}}_{。 j 。} - {\bar{y}}_{…}$
变化的整体意思+复制列因素组的意思是加行因素组的意思是, ${\bar{y}}_{我 j 。} - {\bar{y}}_{我。。} - {\bar{y}}_{。 j 。} + {\bar{y}}_{…}$
从复制意味着变化的观察, $y_{我 j k} - {\bar{y}}_{我 j 。}$

方差分析分区总平方和(SST)的平方和由于行因素一个(SS_一个),由于列平方和的因素B(SS_B),平方和之间的交互一个和B(SS_AB),误差平方和(SSE)。

$\begin{array}{l} \underset{年代年代 T}{\underset{︸}{\sum_{我 = 1}^{米} \sum_{j = 1}^{k} \sum_{r = 1}^{R} {(y_{我 j k} - {\bar{y}}_{…})}^{2}}} = \underset{年代 {年代}_{B}}{\underset{︸}{k R \sum_{我 = 1}^{米} {({\bar{y}}_{我。。} - {\bar{y}}_{…})}^{2}}} + \underset{年代 {年代}_{一个}}{\underset{︸}{米 R \sum_{j = 1}^{k} {({\bar{y}}_{。 j 。} - {\bar{y}}_{…})}^{2}}} \\ + \underset{年代 {年代}_{一个 B}}{\underset{︸}{R \sum_{我 = 1}^{米} \sum_{j = 1}^{k} {({\bar{y}}_{我 j 。} - {\bar{y}}_{我。。} - {\bar{y}}_{。 j 。} + {\bar{y}}_{…})}^{2}}} + \underset{年代年代 E}{\underset{︸}{\sum_{我 = 1}^{米} \sum_{j = 1}^{k} \sum_{r = 1}^{R} {(y_{我 j k} - {\bar{y}}_{我 j 。})}^{2}}} \end{array}$

方差分析的变化由于因子或交互和由于误差与变异进行比较。如果两种变体的比例高,然后因素的影响或交互效果显著。你可以测量使用测试数据有统计学意义F分布。

零假设的行组的平均响应的因素一个检验统计量是相等的,是吗

$F = \frac{\frac{年代 {年代}_{B}}{米 - 1}}{\frac{年代年代 E}{米 k (R - 1)}} \sim F_{米 - 1, 米 k (R - 1)} 。$

零假设的平均响应组的列因素B检验统计量是相等的,是吗

$F = \frac{\frac{年代 {年代}_{一个}}{k - 1}}{\frac{年代年代 E}{米 k (R - 1)}} \sim F_{k - 1, 米 k (R - 1)} 。$

零假设的列和行交互的因素都等于零,检验统计量

$F = \frac{\frac{年代 {年代}_{一个 B}}{(米 - 1) (k - 1)}}{\frac{年代年代 E}{米 k (R - 1)}} \sim F_{(米 - 1) (k - 1), 米 k (R - 1)} 。$

如果p价值的F统计量小于显著性水平,那么方差分析拒绝零假设。最常见的重要性水平是0.01和0.05。

方差分析表

方差分析表捕捉源模型中的变化,F统计测试的意义这个变化,p价值决定这个变化的重要性。的p返回的值anova2取决于假设随机扰动,ε_我j,在模型方程。为p值是正确的,这些干扰需要独立,正态分布,方差不变。标准方差分析表有这种形式:

anova2返回标准方差分析表作为一个单元阵列与6列。

列	定义
`源`	变化的来源。
`党卫军`	由于每个源的平方和。
`df`	与每个源相关的自由度。假设J是团体的数量列因素,我行因素是组织的数量,然后呢R是复制的数量。然后,观察的总数IJR和总自由度IJR- 1。我- 1是自由度为行因素,J- 1的自由度是列因素,(我- 1)(J- 1)交互的自由度,和IJ(R- 1)是错误的自由度。
`女士`	平均每个源广场,这是比例`SS / df`。
`F`	F统计,意思是正方形的比例。
`概率F >`	的p值,也就是概率F统计可以取一个值大于计算检验统计量的值。`anova2`这个概率来自的运作F分布。

方差分析表的行显示变化的数据除以源。

行(源)	定义
`列`	变化由于列因素
`行`	变化由于行因素
`交互`	变化的交互行和列因素
`错误`	变化将在每组数据之间的差异和集团(可变性在组)
`总`	总变化