主要内容

多重比较

介绍

方差分析(ANOVA)技术检验一组均数(治疗效果)是否相等。拒绝零假设导致的结论,不是所有的群体的手段是相同的。然而,这个结果并没有提供关于哪一组的方法是不同的进一步信息。

表演一系列的t不建议使用-测试来确定哪对平均值有显著差异。当你执行多重运算时t-测试,即平均数看起来显著的概率,显著的差异结果可能是由于大量的测试。这些t-测试使用来自相同样本的数据,因此它们不是独立的。这一事实使得量化多重测试的显著性水平变得更加困难。

假设在一个t-检验,零假设(H0)被拒绝时,它实际上是一个小值,比如0.05。再假设你做了六个独立的t- 最低。如果每个测试的显着性水平为0.05,则测试正确未拒绝H的概率0,当H.0为(0.95)6= 0.735。其中一个检验错误拒绝原假设的概率是1 - 0.735 = 0.265,远高于0.05。

为了补偿多个测试,可以使用多个比较过程。统计和机器学习工具箱™功能多人节目执行组手段或治疗效果的多个成对比较。该选项是Tukey的诚实显着的差异标准(默认选项),Bonferroni方法,Scheffe程序,Fisher最低差异(LSD)方法,以及Dunn&Sidák的方法t以及。

要进行组均值的多次比较,请提供结构统计数据作为一个输入多人节目.你可以获得统计数据从下列函数之一:

有关重复测量的多个比较程序选项,请参见多人节目RepeatedMeasuresModel).

使用单因素方差分析的多重比较

加载样例数据。

负载carsmall

MPG.表示每辆车每加仑汽油行驶的里程,以及气瓶表示每辆车中的气缸数,可以是4、6或8个气缸。

测试如果每加仑(MPG)的平均法里程在具有不同数量的汽缸的汽车上是不同的。还计算多个比较测试所需的统计信息。

[p ~统计]= anova1 (MPG,气缸,'离开');p
p = 4.4902 e-24

p-值约为0是一个强烈的指示,每加仑汽油的平均英里数是显著不同的汽车与不同的汽缸。

使用Bonferroni方法进行多重比较测试,以确定汽缸数量对汽车性能的影响。

[结果,意味着]= multcompare(统计数据,'ctype'“bonferroni”

图多个平均值的比较包含一个轴。单击要测试的组包含7个line类型的对象。

结果=3×61.000 2.000 4.8605 7.9418 11.0230 0.0000 1.000 3.000 12.6127 15.2337 17.8548 0.0000 2.000 3.8940 7.2919 10.6899 0.0000
意味着=3×229.5300 0.6363 21.5882 1.0913 14.2963 0.8660

结果矩阵1、2、3分别对应有4、6、8个柱面的汽车。前两列显示了比较哪些组。例如,第一行比较了4个气缸和6个气缸的汽车。第四列显示了比较组的平均mpg差异。第三和第五列显示了组平均值差异的95%置信区间的下限和上限。最后一列显示p-值用于测试。所有p-Values是零,这表明所有组的平均MPG都不同于所有组。

在图中,蓝色条表示一组有4个圆柱体的汽车。红条代表其他组。没有一辆车的平均mpg的红色比较间隔重叠,这意味着平均mpg是显著不同的汽车有4,6,或8缸。

的第一列方法矩阵具有每组汽车的平均MPG估计。第二列包含估计的标准误差。

三方ANOVA的多重比较

加载样例数据。

Y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';G1 = [1 2 1 2 11 2 11 2];g2 = {“嗨”“嗨”“罗”“罗”“嗨”“嗨”“罗”“罗”};g3 = {“可能”“可能”“可能”“可能”“6月”“6月”“6月”“6月”};

y响应向量是和吗g1g2,g3是分组变量(因子)。每个因素有两个层次,每一个观察y是由多个因素水平组合确定的。例如,观察y (1)与因素的级别1相关联g1, 等级“嗨”的因素g2和水平“可能”的因素g3.同样,观察y (6)与因素的第2级相关联g1, 等级“嗨”的因素g2和水平“6月”的因素g3

测试所有因素水平的响应是否相同。还计算多个比较测试所需的统计信息。

[〜,〜,stats] = Anovan(y,{g1 g2 g3},“模型”“互动”...“varnames”, {'g1''G2''g3'});

图n-Way Anova包含UIControl类型的对象。

p-value为0.2578表示水平的平均响应“可能”“6月”的因素g3没有明显的不同。的p-value = 0.0347表示水平的平均响应12的因素g1是明显不同的。类似地,p-value = 0.0048表示水平的平均响应“嗨”“罗”的因素g2是明显不同的。

执行多重比较测试,找出哪组因素g1g2是明显不同的。

结果= Multcompare(统计数据),“维度”,[1 2])

图总体边际均值的多重比较包含一个轴。单击要测试的组包含9个line类型的对象。

结果=6×61.0000 2.0000 -6.8604 -4.4000 -1.9396 0.0272 1.0000 3.0000 4.4896 6.9500 9.4104 0.0170 1.0000 4.170111104 0.01104 0.01104 0.01104 0.01104 0.01104 0.011890

多人节目比较两个分组变量的组(级别)的组合,g1g2.在结果矩阵中,数字1对应的组合水平1g1和水平g2,数字2对应水平的组合2g1和水平g2.同样,数字3对应的是水平组合1g1和水平g2,数字4对应水平的组合2g1和水平g2.矩阵的最后一列包含p值。

例如,矩阵的第一行显示了级别的组合1g1和水平g2具有与水平的组合相同的平均响应值2g1和水平g2.的p该检验对应的-value为0.0280,说明均值响应存在显著性差异。您还可以在图中看到这个结果。蓝色条表示水平组合的平均响应比较区间1g1和水平g2.红条是其他组组合的平均反应的比较区间。红色条与蓝色条没有重叠,这表示水平组合的平均响应1g1和水平g2与其他组合组合的平均反应显着不同。

您可以通过单击组对应的比较间隔来测试其他组。你点击的栏变成蓝色。有显著差异的组用红色表示。没有显著差异的组用灰色条表示。例如,如果您点击的比较间隔为组合级别1g1和水平g2,为组合水平的比较间隔2g1和水平g2重叠,因此是灰色的。相反,其他比较间隔是红色的,表明显着差异。

多重比较过程

指定所需的多个比较过程多人节目进行使用'ctype'名称-值对的论点。多人节目提供以下步骤:

Tukey 's honest Significant Difference Procedure

您可以使用诚实地指定Tukey的诚实差异差异“CType”、“Tukey-Kramer”'ctype','hsd'名称-值对的论点。该测试基于学生范围分布。拒绝H0α.α.j如果

| t | | y ¯ y ¯ j | 年代 E 1 n + 1 n j > 1 2 α. k N k

在哪里 α. k N k 鞋面100 *(1 -α.)第1百分位的研究范围分布带参数kN- - - - - -k自由程度。k是群体数量(治疗或边缘手段)和N是观测的总数。

Tukey的诚实差异术语对于平衡单向ANOVA和具有相同样本尺寸的类似程序是最佳的最佳选择。已被证明是保守的单向ANOVA,具有不同的样本尺寸。根据未经证实的Tukey-Kramer猜想,它还准确地用于所比较的数量相关的问题,如在与不平衡的协变量值的协方差分析中。

Bonferroni方法

属性指定Bonferroni方法“CType”、“bonferroni”名称-值对。这种方法使用来自Student’s的临界值t-调整后的分布,以补偿多次比较。测试拒绝H0α.α.j α. / 2 k 2 显著性水平,k组的数量是否

| t | | y ¯ y ¯ j | 年代 E 1 n + 1 n j > t α. 2 k 2 N k

在哪里N观察的总数是多少k是组的数量(边际平均值)。这个方法比较保守,但通常不如Scheffé方法保守。

Dunn & Sidák的方法

您可以指定Dunn & Sidák的方法使用“CType”、“dunn-sidak”名称-值对的论点。的临界值t-distribution,经过多次比较的调整后,由Dunn提出,Sidák证明是准确的。这个测试拒绝H0α.α.j如果

| t | | y ¯ y ¯ j | 年代 E 1 n + 1 n j > t 1 η. / 2 v

在哪里

η. 1 1 α. 1 k 2

k是群体的数量。该程序类似于Bonferroni程序,但较少保守。

最小显著性差异

您可以使用该方法指定最小重要性差异程序“CType”、“迷幻药”名称-值对的论点。这个测试使用测试统计量

t y ¯ y ¯ j 年代 E 1 n + 1 n j

它拒绝H0α.α.j如果

| y ¯ y ¯ j | > t α. 2 N k 年代 E 1 n + 1 n j l 年代 D

费雪建议,只有在零假设H时才执行LSD,以防止多重比较0α.1α.2=……=α.k被方差分析拒绝了吗F以及。即使在这种情况下,LSD也可能不会拒绝任何个人假设。Anova也可能不会拒绝h0,即使某些群体之间存在差异。这种行为的发生是因为剩余群体的平等意味着可以导致F- 最重要的统计数据。没有任何条件,LSD不提供对多个比较问题的任何保护。

矫正的过程

您可以使用scheffe使用scheffe的程序“CType”、“矫正”名称-值对的论点。临界值由F分配。测试拒绝H0α.α.j如果

| y ¯ y ¯ j | 年代 E 1 n + 1 n j > k 1 F k 1 N k α.

这个程序提供了同时的置信水平,以比较所有的线性组合的平均数。对简单的差异进行比较是保守的。

参考

[1] Milliken G. A.和D. E. Johnson。凌乱数据的分析。第一卷:设计实验.波卡拉顿:查普曼和霍尔出版社,1992。

[2] Neter J., M. H. Kutner, C. J. Nachtsheim, W. Wasserman.第四版。应用线性统计模型.Irwin出版社,1996年。

[3] Hochberg,Y.和A. C. Tamhane。多重比较过程.Hoboken, NJ: John Wiley & Sons, 1987。

另请参阅

||||||

相关的话题