主要内容

多重比较

简介

方差分析(ANOVA)技术测试一组组均值(治疗效果)是否相等。拒绝零假设的结果是,并非所有的群体均值都是相同的。然而,这一结果并没有提供关于哪一组的平均数不同的进一步信息。

表演一系列t不建议使用-测试来确定哪一对平均值有显著差异。当您执行多个t-tests表示均值显著性的概率,显著性的差异结果可能是由于大量的测试。这些t-tests使用来自相同样本的数据,因此它们不是独立的。这一事实使得量化多重测试的显著性水平变得更加困难。

假设在一个单一的t-test,零假设(H0)被拒绝时,它实际上是一个很小的值,比如0.05。再假设你进行了六个独立的t测试。如果每个检验的显著性水平为0.05,则检验正确拒绝H的概率0,当H0对每个情况都成立,为(0.95)6= 0.735。其中一个检验错误拒绝原假设的概率为1 - 0.735 = 0.265,远高于0.05。

要补偿多个测试,可以使用多个比较过程。统计和机器学习工具箱™功能multcompare对组均值或治疗效果进行多次两两比较。这些选项是Tukey的显著差异标准(默认选项),Bonferroni方法,Scheffe的过程,Fisher的最小显著差异(lsd)方法,以及Dunn和Sidák的方法t以及。

要执行组均值的多次比较,请提供结构统计数据作为输入multcompare.你可以获得统计数据从以下函数之一:

有关重复测量的多个比较过程选项,请参见multcompareRepeatedMeasuresModel).

单因素方差分析的多重比较

加载样例数据。

负载carsmall

英里/加仑表示每辆车每加仑汽油行驶的英里数气缸表示每辆车的汽缸数,可以是4、6或8汽缸。

测试每加仑(mpg)的平均里程是否不同的汽车有不同的汽缸数量。还要计算多个比较测试所需的统计信息。

[p ~统计]= anova1 (MPG,气缸,“关闭”);p
p = 4.4902 e-24

p-值约为0强烈表明,不同汽缸数量的汽车每加仑行驶里程有显著差异。

使用Bonferroni方法进行多次比较测试,以确定气缸的数量对汽车的性能有影响。

[结果,意味着]= multcompare(统计数据,“CType”“bonferroni”

图均值的多重比较包含一个坐标轴对象。单击要测试的组的带有标题的axes对象包含7个类型为line的对象。

结果=3×61.000 2.0000 4.8605 7.9418 11.0230 0.0000 1.0000 3.0000 12.6127 15.2337 17.8548 0.0000 2.0000 3.0000 3.8940 7.2919 10.6899 0.0000
意味着=3×229.5300 0.6363 21.5882 1.0913 14.2963 0.8660

结果矩阵,1,2,3分别对应4,6,8气缸的汽车。前两列显示了哪些组进行了比较。例如,第一行比较了4缸和6缸的汽车。第四列显示了比较组的平均每英里数的差异。第三列和第五列显示组均值差异的95%置信区间的下限和上限。最后一列显示p-测试的值。所有p-值为零,这表明所有组的平均MPG在所有组之间是不同的。

在图中,蓝色条表示一组有4个汽缸的汽车。红条代表其他组。汽车的平均每英里行驶里程的红色比较区间没有重叠,这意味着拥有4、6或8缸的汽车的平均每英里行驶里程显著不同。

的第一列意味着矩阵有每组车的平均MPG估计。第二列是估计值的标准误差。

三向方差分析的多重比较

加载样例数据。

Y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';G1 = [1 2 1 2 1 2 1 2];g2 = {“嗨”“嗨”“罗”“罗”“嗨”“嗨”“罗”“罗”};g3 = {“可能”“可能”“可能”“可能”“6月”“6月”“6月”“6月”};

y响应向量和g1g2,g3是分组变量(因子)。每个因素都有两个层次,而每一个观察都在y是由因素水平的组合确定的。例如,观察y (1)与因子的1级有关g1、水平“嗨”的因素g2,和水平“可能”的因素g3.同样,观察y (6)与第2级因子有关g1、水平“嗨”的因素g2,和水平“6月”的因素g3

测试所有因素水平的响应是否相同。还要计算多个比较测试所需的统计信息。

[~,~,stats] = anovan(y,{g1 g2 g3},“模型”“互动”...“varnames”,{g1的“g2”“g3”});

图N-Way ANOVA包含uicontrol类型的对象。

p-value of 0.2578表示对水平的平均响应“可能”而且“6月”的因素g3没有显著差异。的p-value of 0.0347表示对水平的平均响应1而且2的因素g1是明显不同的。类似地,p-value的0.0048表示水平的平均响应“嗨”而且“罗”的因素g2是明显不同的。

执行多个比较测试以找出哪些组的因素g1而且g2是明显不同的。

结果= multcompare(统计,“维度”[1, 2])

图总体边际均值的多重比较包含一个坐标轴对象。单击要测试的组的带有标题的axes对象包含9个类型为line的对象。

结果=6×61.000 2.0000 -6.8604 -4.4000 -1.9396 0.0272 1.0000 3.0000 4.4896 6.9500 9.4104 0.0170 1.0000 4.0000 6.1396 8.6000 11.0604 0.0136 2.0000 3.0000 8.8896 11.3500 13.8104 0.0101 2.0000 4.0000 10.5396 13.0000 15.4604 0.0087 3.0000 4.0000 -0.8104 1.6500 4.1104 0.0737

multcompare比较两个分组变量的组(级)组合,g1而且g2.在结果矩阵中,数字1对应的是水平的组合1g1和水平g2,数字2对应等级的组合2g1和水平g2.类似地,数字3对应的是级别的组合1g1和水平g2,数字4对应等级的组合2g1和水平g2.矩阵的最后一列包含p值。

例如,矩阵的第一行表示组合水平1g1和水平g2是否与水平组合的平均响应值相同2g1和水平g2.的p-value为0.0280,说明平均响应差异显著。您也可以在图中看到这个结果。蓝色条表示水平组合的平均响应的比较区间1g1和水平g2.红色条是其他组组合的平均反应的比较区间。红色条形图与蓝色条形图没有重叠,这表示水平组合的平均响应1g1和水平g2与其他组组合的平均反应显著不同。

您可以通过单击组的对应比较间隔来测试其他组。你点击的工具条会变成蓝色。显著差异组的柱状图为红色。没有显著差异的组的柱状图是灰色的。例如,如果单击级别组合的比较间隔1g1和水平g2,为水平组合的比较区间2g1和水平g2重叠,因此是灰色的。相反,其他比较区间为红色,表示差异显著。

多重比较过程

指定所需的多重比较过程multcompare进行使用“CType”名称-值对的论点。multcompare提供以下程序:

杜克诚实显著差异程序

你可以指定Tukey的显著差异过程使用“CType”、“Tukey-Kramer”“CType”、“hsd”名称-值对的论点。测试基于学生化的范围分布。拒绝H0ααj如果

| t | | y ¯ y ¯ j | 年代 E 1 n + 1 n j > 1 2 α k N k

在哪里 α k N k 上100是否*(1 -α)带参数的学生化范围分布的第th百分位k而且N- - - - - -k的自由度。k组数(处理或边际均值)和N是观察的总数。

Tukey的显著差异程序是平衡单向方差分析和相同样本量的类似程序的最佳选择。对于不同样本量的单因素方差分析,它已被证明是保守的。根据未经证实的Tukey-Kramer猜想,它对于被比较的数量是相关的问题也是准确的,如在协变量值不平衡的协方差分析中。

Bonferroni方法

方法可以指定Bonferroni方法“CType”、“bonferroni”名称-值对。该方法使用来自Student的临界值t-调整后的分布,以补偿多次比较。测试拒绝H0ααj α / 2 k 2 显著性水平,k组的数量是否

| t | | y ¯ y ¯ j | 年代 E 1 n + 1 n j > t α 2 k 2 N k

在哪里N观察的总数和k为组数(边际均值)。这个过程是保守的,但通常不如Scheffé过程保守。

邓恩和Sidák的方法

方法指定Dunn & Sidák的方法“CType”、“dunn-sidak”名称-值对的论点。的临界值t-分布,在调整了Dunn提出的多次比较,并被Sidák证明是准确的。这个测试拒绝H0ααj如果

| t | | y ¯ y ¯ j | 年代 E 1 n + 1 n j > t 1 η / 2 v

在哪里

η 1 1 α 1 k 2

而且k是组数。这种方法与Bonferroni方法相似,但没有Bonferroni方法保守。

最小显著性差异

方法可以指定最小显著性差异过程“CType”、“迷幻药”名称-值对的论点。该测试使用测试统计信息

t y ¯ y ¯ j 年代 E 1 n + 1 n j

它拒绝H0ααj如果

| y ¯ y ¯ j | > t α 2 N k 年代 E 1 n + 1 n j l 年代 D

Fisher建议,只有当零假设H0α1α2=……=αk被方差分析拒绝F以及。即使在这种情况下,LSD可能也不会拒绝任何一个单独的假设。方差分析也有可能不排斥H0,即使在某些群体之间存在差异。发生这种行为是因为其余组均值的相等会导致F-test统计数据不显著。如果没有任何条件,LSD不能对多重比较问题提供任何保护。

矫正的过程

方法可以指定Scheffe过程“CType”、“矫正”名称-值对的论点。临界值由F分布。测试拒绝H0ααj如果

| y ¯ y ¯ j | 年代 E 1 n + 1 n j > k 1 F k 1 N k α

这个过程为平均数的所有线性组合的比较提供了一个同时的置信水平。对的简单差的比较是保守的。

参考文献

[1]米利肯G. A.和D. E.约翰逊。凌乱数据分析。第一卷:设计实验.佛罗里达州博卡拉顿:查普曼和霍尔/CRC出版社,1992年。

[2] Neter J., M. H. Kutner, C. J. Nachtsheim, W. Wasserman.第四版。应用线性统计模型.Irwin出版社,1996年。

[3] Hochberg, Y.和A. C. Tamhane。多重比较过程.霍博肯,新泽西州:约翰威利父子公司,1987年。

另请参阅

||||||

相关的话题