方差分析(ANOVA)技术检验一组组的平均数(治疗效果)是否相等。拒绝零假设可以得出结论:不是所有的组均值都是相同的。然而,这一结果并没有提供关于哪一组方法不同的进一步信息。
表演一系列t不建议使用-测试来确定哪些平均值对存在显著差异。当你执行多个t-测试时,平均值显得显著的概率,显著差异的结果可能是由于大量的测试。这些t测试使用来自同一个样本的数据,因此它们不是独立的。这一事实使得量化多重测试的显著性水平变得更加困难。
假设在一个t-test,零假设(H0)被拒绝,当它实际上是一个小值,例如0.05。再假设你指挥6个独立的t测试。如果每个检验的显著性水平为0.05,则该检验正确拒绝H0,当H0为(0.95)6= 0.735。其中一个检验错误地拒绝零假设的概率为1 - 0.735 = 0.265,远远高于0.05。
为了补偿多个测试,可以使用多个比较过程。统计和机器学习工具箱™功能multcompare
对组平均数或治疗效果进行多次两两比较。这些选项是Tukey的诚实显著性差异标准(默认选项),Bonferroni方法,Scheffe方法,Fisher的最小显著性差异(lsd)方法,以及Dunn和Sidak的方法t以及。
要执行组方法的多次比较,请提供结构统计数据
作为输入multcompare
.你可以获得统计数据
从下列函数之一:
有关重复测量的多重比较程序选项,请参见multcompare
(RepeatedMeasuresModel
).
加载示例数据。
负载carsmall
英里/加仑
代表每辆车每加仑行驶的英里数气缸
表示每辆车的气缸数,可以是4个、6个或8个气缸。
测试不同汽缸数的汽车每加仑平均行驶里程是否不同。还要计算多次比较测试所需的统计数据。
[p ~统计]= anova1 (MPG,气缸,“关闭”);p
p = 4.4902 e-24
小p-值约为0,强烈表明不同汽缸数的汽车每加仑汽油的平均英里数存在显著差异。
使用Bonferroni方法进行多重比较测试,以确定哪些气缸的数量对赛车的性能有影响。
[结果,意味着]= multcompare(统计数据,“CType”,“bonferroni”)
结果=3×61.0000 2.0000 4.8605 7.9418 11.0230 0.0000 1.0000 3.0000 12.6127 15.2337 17.8548 0.0000 2.0000 3.0000 3.8940 7.2919 10.6899 0.0000
意味着=3×229.5300 0.6363 21.5882 1.0913 14.2963 0.8660
在结果
矩阵1、2、3分别对应4、6、8个气缸的汽车。前两列显示了比较哪些组。例如,第一行比较了4缸和6缸的汽车。第四列显示了比较组的平均mpg差异。第三和第五列显示了组平均值差异的95%置信区间的下限和上限。最后一列显示p测试的-值。所有p-值为零,表示所有组的平均MPG在所有组中是不同的。
在图中,蓝条表示有4个气缸的一组汽车。红色的条代表其他组。红色的比较区间没有重叠,这意味着4个、6个或8个汽缸的汽车的平均mpg是显著不同的。
的第一列意味着
矩阵中有每组汽车的平均MPG估计值。第二列包含估计的标准误差。
加载示例数据。
Y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';G1 = [1 2 1 2 1 2];g2 = {“嗨”;“嗨”;“罗”;“罗”;“嗨”;“嗨”;“罗”;“罗”};g3 = {“可能”;“可能”;“可能”;“可能”;“6月”;“6月”;“6月”;“6月”};
y
是响应向量和吗g1
,g2
,g3
为分组变量(因素)。每一个因素都有两个层次,每一个观察y
是由因素水平的组合来确定的。例如,观察y (1)
与第一级因子有关吗g1
、水平“嗨”
的因素g2
,和水平“可能”
的因素g3
.同样,观察y (6)
与2级因子有关吗g1
、水平“嗨”
的因素g2
,和水平“6月”
的因素g3
.
测试所有因素水平的响应是否相同。还要计算多个比较测试所需的统计数据。
[~,~,stats] = anovan(y,{g1 g2 g3}),“模型”,“互动”,...“varnames”,{g1的,“g2”,“g3”});
的p-值为0.2578表示水平的平均响应“可能”
和“6月”
的因素g3
并没有显著的不同。的p-value为0.0347表示水平的平均响应1
和2
的因素g1
是明显不同的。类似地,p-值0.0048表示水平的平均响应“嗨”
和“罗”
的因素g2
是明显不同的。
执行多个比较测试以找出哪些因素组g1
和g2
是明显不同的。
结果= multcompare(统计,“维度”[1, 2])
结果=6×61.0000 2.0000 -6.8604 -4.4000 -1.9396 0.0280 1.0000 3.0000 4.4896 6.9500 9.4104 0.0177 1.0000 4.0000 6.1396 8.6000 11.0604 0.0143 2.0000 3.0000 8.8896 11.3500 13.8104 0.0108 2.0000 4.0000 10.5396 13.0000 15.4604 0.0095 3.0000 4.0000 -0.8104 1.6500 4.1104 0.0745
multcompare
比较两个分组变量的组(水平)的组合,g1
和g2
.在结果
矩阵中,数字1对应的组合电平1
的g1
和水平嗨
的g2
,数字2对应水平的组合2
的g1
和水平嗨
的g2
.同样,数字3对应的是level的组合1
的g1
和水平罗
的g2
,数字4对应level的组合2
的g1
和水平罗
的g2
.矩阵的最后一列包含p值。
例如,矩阵的第一行表示等级的组合1
的g1
和水平嗨
的g2
是否与水平组合具有相同的平均响应值2
的g1
和水平嗨
的g2
.的p-值为0.0280,说明平均响应差异显著。你也可以在图中看到这个结果。蓝条显示了水平组合的平均响应的比较区间1
的g1
和水平嗨
的g2
.红色条是其他组组合的平均反应的比较区间。红色条与蓝色条没有重叠,这意味着水平组合的平均响应1
的g1
和水平嗨
的g2
与其他组组合的平均反应有显著差异。
您可以通过单击该组对应的比较间隔来测试其他组。你点击的栏变成蓝色。显著不同的组的条形图是红色的。没有显著差异的组的条形图是灰色的。例如,如果您单击级别组合的比较间隔1
的g1
和水平罗
的g2
,比较间隔为组合电平2
的g1
和水平罗
的g2
重叠,因此是灰色的。相反,其他比较区间为红色,表示差异显著。
来指定您想要的多重比较过程multcompare
进行使用“CType”
名称-值对的论点。multcompare
提供以下步骤:
你可以用“CType”、“Tukey-Kramer”
或“CType”、“hsd”
名称-值对的论点。该测试是基于研究的范围分布。拒绝H0:α我=αj如果
在哪里 上面的100*(1 -α)所研究的带参数的极差分布的第百分位k和N- - - - - -k的自由度。k组数(治疗或边际手段)和N为观测总数。
Tukey的诚实显著差异程序是平衡单因素方差分析和相同样本大小的类似程序的最优方法。对于不同样本量的单因素方差分析,已被证明是保守的。根据未经证实的Tukey-Kramer猜想,它对于被比较的数量是相关的问题也是准确的,如在分析带有不平衡协变量值的协方差时。
的方法可以指定Bonferroni方法“CType”、“bonferroni”
名称-值对。该方法使用学生的临界值t-分配后的调整,以补偿多次比较。测试拒绝H0:α我=αj在
显著性水平,k组数是否为
在哪里N是观察总数和k为组数(边际平均值)。这种方法比较保守,但通常不如Scheffé方法保守。
您可以指定Dunn和Sidak的方法使用“CType”、“dunn-sidak”
名称-值对的论点。它使用的是t-分布,经过Dunn提出的多次比较的调整,并被Sidák证明是准确的。这个测试拒绝H0:α我=αj如果
在哪里
和k为组的个数。这种方法与Bonferroni方法相似,但比Bonferroni方法保守。
的方法可以指定最小显著性差异过程“CType”、“迷幻药”
名称-值对的论点。这个测试使用测试统计量
它拒绝H0:α我=αj如果
Fisher提出了一种防止多重比较的方法,即只在零假设H0:α1=α2=……=αk被方差分析拒绝F以及。即使在这种情况下,LSD也不能否定任何个体假设。也有可能方差分析不排斥H0,即使在某些组之间存在差异。发生这种行为是因为其余组的相等方法可能导致F-检验统计量为不显著。在没有任何条件的情况下,LSD不能提供任何针对多重比较问题的保护。
属性指定Scheffe过程“CType”、“矫正”
名称-值对的论点。临界值是由F分布。测试拒绝H0:α我=αj如果
此程序为所有线性组合的平均值的比较提供了同时的置信水平。对简单差异的比较是保守的。
米利肯g.a.和d。e。约翰逊。杂乱数据分析。第一卷:设计实验.佛罗里达州博卡拉顿:查普曼和霍尔/CRC出版社,1992年。
Neter J., M. H. Kutner, C. J. Nachtsheim, W. Wasserman.第四版。应用线性统计模型.Irwin出版社,1996年。
Hochberg Y.和a.c. Tamhane。多重比较过程.霍博肯:约翰·威利父子公司,1987。
anova1
|anova2
|anovan
|aoctool
|弗里德曼
|kruskalwallis
|multcompare