多重比较

介绍

方差分析（ANOVA）技术测试是否一组组装置（治疗效果）等于与否。拒绝零假设导致得出结论，并非所有组织意味着相同。然而，此结果不提供有关哪些组手段不同的信息。

执行一系列T.- 不建议确定哪对手段显着不同。执行多个时T.- 最低，手段显得显着的概率，并且显着的差异结果可能是由于大量的测试。这些T.- 最低使用来自同一样本的数据，因此它们不是独立的。这一事实使得量化多次测试的重要性更加困难。

假设在一个单一的时候T.- 最低，零假设的概率（h_0.例如，当它实际上是一个小的价值，说0.05。也假设您进行六个独立行为T.- 最低。如果每个测试的显着性水平为0.05，则测试正确未拒绝H的概率_0.，当H._0.对每种情况都是如此，是（0.95）^6.= 0.735。并且其中一个测试错误拒绝零假设的可能性是1 - 0.735 = 0.265，远高于0.05。

要补偿多个测试，您可以使用多个比较程序。统计和机器学习工具箱™功能多人节目执行组手段或治疗效果的多个成对比较。该选项是Tukey的诚实显着的差异标准（默认选项），Bonferroni方法，Scheffe程序，Fisher最低差异（LSD）方法，以及Dunn＆Sidák的方法T.-测试。

要执行多种比较组手段，请提供结构统计作为一个输入多人节目。你可以获得统计根据以下功能之一：

有关重复措施的多个比较过程选项，请参阅多人节目（重复地段索赔）。

使用单向ANOVA的多重比较

打开直播脚本

加载样本数据。

加载Carsmall.

MPG.代表每辆车的每加仑里程，气瓶表示每辆车，4,6或8个气缸中的圆柱体的数量。

测试如果每加仑（MPG）的平均法里程在具有不同数量的汽缸的汽车上是不同的。还计算多个比较测试所需的统计信息。

[p，〜，stats] = Anova1（MPG，圆柱体，'离开'）;P.

P = 4.4902E-24

小P.- 约0的值是一个强烈的指示，即每加仑的平均数程数在具有不同数量的汽缸的汽车上具有显着差异。

使用Bonferroni方法执行多个比较测试，以确定哪些数量的汽缸在汽车的性能下产生差异。

[结果，手段] = Multcompare（统计数据）'ctype'那'bonferroni'）

结果=3×6.1.0000 2.0000 4.8605 7.9418 11.0230 0.0000 0.0000 1.0000 3.0000 12.6127 15.2337 17.8548 0.0000 2.0000 3.0000 3.8940 7.2919 10.6899 0.0000

手段=3×229.5300 0.6363 21.5882 1.0913 14.2963 0.8660

在里面结果矩阵，1,2和3分别对应于带有4,6和8个汽缸的汽车。前两列显示比较哪些组。例如，第一行将车辆与4和6个气缸进行比较。第四列显示了比较组的平均MPG差异。第三和第五列显示出95％置信区间的下限和上限，用于群体的差异。最后一列显示P.- 用于测试的值。全部P.-Values是零，这表明所有组的平均MPG都不同于所有组。

在图中，蓝栏代表带有4个气缸的汽车组。红条代表另一组。对于汽车的平均MPG的红色比较间隔都没有，这意味着对于具有4,6或8个气缸的汽车的平均MPG显着不同。

第一列方法矩阵具有每组汽车的平均MPG估计。第二列包含估计的标准误差。

三方ANOVA的多重比较

打开直播脚本

加载样本数据。

Y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';G1 = [1 2 1 2 11 2 11 2];g2 = {'你好';'你好';'lo';'lo';'你好';'你好';'lo';'lo'};g3 = {'可能';'可能';'可能';'可能';'六月';'六月';'六月';'六月'};

y是响应矢量和G1.那G2.，和G3.是分组变量（因素）。每个因素有两个级别，每一个观察y通过因子水平的组合来识别。例如，观察Y（1）与因素的级别1相关联G1.，等级'你好'因子G2.和水平'可能'因子G3.。同样，观察y（6）与因素的第2级相关联G1.，等级'你好'因子G2.和水平'六月'因子G3.。

测试是否对所有因子级别相同。还计算多个比较测试所需的统计信息。

[〜，〜，stats] = Anovan（y，{g1 g2 g3}，'模型'那'相互作用'那......'varnames'，{'g1'那'G2'那'g3'}）;

这P.- 0.2578的值表明水平的平均反应'可能'和'六月'因子G3.没有显着差异。这P.- 0.0347的值表明水平的平均反应1和2因子G1.显着不同。同样，P.- 0.0048的值表明水平的平均反应'你好'和'lo'因子G2.显着不同。

执行多个比较测试，以了解哪些因素G1.和G2.显着不同。

结果= Multcompare（统计数据），'尺寸'，[1 2]）

结果=6×6.1.0000 2.0000 -6.8604 -4.4000 -1.9396 0.0280 1.0000 1.0000 4.4896 6.9500 9.4104 0.0177 1.0000 4.11.696 8.11104 0.0104 0.0104 0.0104 0.0104 0.01104 0.0104 0.01104 0.011011.0000 4.0401396

多人节目比较两个分组变量的组（级别）的组合，G1.和G2.。在里面结果矩阵，数字1对应于级别的组合1的G1.和水平你好的G2.，数字2对应于级别的组合2的G1.和水平你好的G2.。类似地，数字3对应于级别的组合1的G1.和水平lo的G2.，数字4对应于级别的组合2的G1.和水平lo的G2.。矩阵的最后一列包含P.- 值。

例如，矩阵的第一行显示了级别的组合1的G1.和水平你好的G2.具有与水平的组合相同的平均响应值2的G1.和水平你好的G2.。这P.- 对应于该测试的价值是0.0280，表明平均响应显着不同。您还可以看到该图中的结果。蓝色条形显示相对于水平组合的平均响应的比较间隔1的G1.和水平你好的G2.。红色条是其他组合的平均响应的比较间隔。没有一个红色条与蓝杆重叠，这意味着对水平组合的平均反应1的G1.和水平你好的G2.与其他组合组合的平均反应显着不同。

您可以通过单击该组的相应比较间隔来测试其他组。您点击转向蓝色的栏。对于显着不同的群体的条形是红色的。对于没有显着不同的群体的条形是灰色的。例如，如果单击比较间隔以进行级别的组合1的G1.和水平lo的G2.，相对水平的比较间隔2的G1.和水平lo的G2.重叠，因此是灰色的。相反，其他比较间隔是红色的，表明显着差异。

多个比较程序

指定所需的多个比较过程多人节目进行使用'ctype'名称值对参数。多人节目提供以下步骤：

Tukey的诚实差异差异
Bonferroni方法
邓恩和斯蒂瓦克的方法
最不重要的差异
Scheffe的程序

Tukey的诚实差异差异

您可以使用诚实地指定Tukey的诚实差异差异'ctype'，'tukey-kramer'或者'ctype'，'hsd'名称值对参数。该测试基于学生化范围分布。拒绝H_0.：α._一世=α._j如果

$| T. | = \frac{| {\bar{y}}_{一世} - {\bar{y}}_{j} |}{\sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}} > \frac{1}{\sqrt{2}} {问：}_{α. 那 K. 那 N - K. 那}$

在哪里 ${问：}_{α. 那 K. 那 N - K.}$ 鞋面100 *（1 -α.）学生化范围分布的百分位数与参数K.和N-K.自由程度。K.是群体数量（治疗或边缘手段）和N是观察总数。

Tukey的诚实差异术语对于平衡单向ANOVA和具有相同样本尺寸的类似程序是最佳的最佳选择。已被证明是保守的单向ANOVA，具有不同的样本尺寸。根据未经证实的Tukey-Kramer猜想，它还准确地用于所比较的数量相关的问题，如在与不平衡的协变量值的协方差分析中。

Bonferroni方法

您可以使用该方法指定Bonferroni方法'ctype'，'bonferroni'名称值对。此方法使用学生的临界值T.- 调整后分布措施以补偿多项比较。测试拒绝H_0.：α._一世=α._j当 $α. / 2 （ \begin{array}{l} K. \\ 2 \end{array} ）$ 意义水平，在哪里K.是群组的数量

$| T. | = \frac{| {\bar{y}}_{一世} - {\bar{y}}_{j} |}{\sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}} > {T.}_{\frac{α.}{2 （ \begin{matrix} K. \\ 2 \end{matrix} ）} 那 N - K. 那}$

在哪里N是观察总数和K.是群体数量（边缘手段）。这个程序是保守的，但通常比Scheffé程序更少。

邓恩和斯蒂瓦克的方法

您可以使用Dunn＆Sidák的方法使用'ctype'，'dunn-sidak'名称值对参数。它使用来自的临界值T.- 在调整Dunn提出的多种比较后调整后，通过Sidák准确进行了调整。此测试拒绝H_0.：α._一世=α._j如果

$| T. | = \frac{| {\bar{y}}_{一世} - {\bar{y}}_{j} |}{\sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}} > {T.}_{1 - η. / 2 那 V. 那}$

在哪里

$η. = 1 - {（ 1 - α. ）}^{^{\frac{1}{（ \begin{array}{l} K. \\ 2 \end{array} ）}}}$

和K.是群体的数量。该程序类似于Bonferroni程序，但较少保守。

最不重要的差异

您可以使用该方法指定最小重要性差异程序'ctype'，'lsd'名称值对参数。此测试使用测试统计

$T. = \frac{{\bar{y}}_{一世} - {\bar{y}}_{j}}{\sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}} 。$

它拒绝H_0.：α._一世=α._j如果

$| {\bar{y}}_{一世} - {\bar{y}}_{j} | > \underset{L. S. D.}{\underset{}}{{T.}_{\frac{α.}{2} 那 N - K.} \sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}}} 。$

Fisher仅在零假设H时执行LSD来保护对多重比较的保护_0.：α.₁=α.₂= ... =α._K.由Anova拒绝F-测试。即使在这种情况下，LSD也可能不会拒绝任何个人假设。Anova也可能不会拒绝h_0.，即使某些群体之间存在差异。出现这种行为是因为剩余群体的平等意味着可能导致F- 最重要的统计数据。没有任何条件，LSD不提供对多个比较问题的任何保护。

Scheffe的程序

您可以使用scheffe使用scheffe的程序'ctype'，'scheffe'名称值对参数。临界值来自于F分配。测试拒绝H_0.：α._一世=α._j如果

$\frac{| {\bar{y}}_{一世} - {\bar{y}}_{j} |}{\sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}} > \sqrt{（ K. - 1 ） F_{K. - 1 那 N - K. 那 α.}}$

该过程提供了一种同时置信水平，用于比较手段的所有线性组合。对于简单的对差异的比较是保守的。

参考

[1] Milliken G. A.和D. E. Johnson。杂乱数据分析。卷I：设计实验。Boca Raton，FL：Chapman＆Hall / CRC Press，1992。

[2]网络J.，M.H.Kutner，C.J.Nachtsheim，W. Wasserman。第四届。应用线性统计模型1996年。

[3] Hochberg，Y.和A. C. Tamhane。多个比较程序。霍博肯，NJ：John Wiley＆Sons，1987。

也可以看看