主要内容

multcompare

多重比较检验

描述

例子

c= multcompare (统计数据返回一个矩阵c中包含的信息的多重比较测试的两两比较结果统计数据结构。multcompare还显示了评估和比较间隔的交互式图表。每组平均值用一个符号表示,区间用从符号延伸出来的一条线表示。如果两组平均值的间隔不一致,则两组平均值有显著差异;如果它们的间隔是重叠的,那么它们就没有显著的不同。如果您使用鼠标选择任何组,那么图形将突出显示所有其他显著不同的组(如果有的话)。

例子

c= multcompare (统计数据名称,值返回一个成对比较结果的矩阵,c,使用由一个或多个指定的其他选项名称,值对参数。例如,您可以指定置信区间或在多重比较中使用的临界值类型。

c) = multcompare (___也返回一个矩阵,,它包含每一组的平均值(或正在比较的任何统计数字)的估计值和相应的标准误差。您可以使用前面的任何语法。

ch) = multcompare (___也返回一个句柄,h,到比较图。

例子

chgnames) = multcompare (___也返回单元格数组,gnames,其中包含组的名称。

例子

全部折叠

加载示例数据。

负载carsmall

执行单向方差分析(ANOVA),看看是否有任何不同的里程的汽车的来源。

(p t统计)= anova1 (MPG,起源,“关闭”);

对组平均值进行多次比较。

(c m h, nms) = multcompare(统计);

图多重平均数比较包含一个坐标轴。带有标题的轴单击要测试的组包含13个类型为line的对象。

multcompare显示估算值及其周围的比较间隔。你可以点击每个国家的图表,将其平均值与其他国家的平均值进行比较。

现在用相应的组名显示平均估计和标准误差。

(nms num2cell (m))
ans =6×3单元阵列{'美国'}{[21.1328]}{[0.8814]}{‘日本’}{[31.8000]}{[1.8206]}{“德国”}{[28.4444]}{[2.3504]}{“法国”}{[23.6667]}{[4.0711]}{“瑞典”}{[22.5000]}{[4.9860]}{“意大利”}{[28]}{[7.0513]}

加载示例数据。

负载爆米花爆米花
爆米花=6×35.5000 4.5000 3.5000 5.5000 4.5000 4.0000 6.0000 4.0000 3.0000 6.5000 5.0000 4.0000 4.0000 4.0000 7.0000 5.5000 5.0000 7.0000 5.5000

数据来自一项关于爆米花品牌和爆米花类型的研究(Hogg 1987)。矩阵的列爆米花都是品牌(Gourmet, National和Generic)。行是很时髦的油和空气。在这项研究中,研究人员用每个牌子的爆米花爆三次。这些值是爆米花杯的收益率。

进行双向方差分析。还要计算需要对主要效果执行多重比较测试的统计信息。

[~, ~,统计]= anova2(爆米花,3,“关闭”
统计=结构体字段:来源:'anova2' sigmasq: 0.1389 colmeans: [6.2500 4.7500 4] coln: 6 rowmeans: [4.5000 5.5000] row: 9 inter: 1 pval: 0.7462 df: 12

统计数据结构包括

  • 均方误差(sigmasq

  • 每个爆米花品牌的平均收益估计(colmeans

  • 每个爆米花品牌的观察次数(coln

  • 每个popper类型的平均产量估计值(rowmeans

  • 每种popper类型的观测次数(地区

  • 交互次数(国际米兰

  • p-表示交互项显著性水平的值(pval

  • 误差自由度(df).

执行多重比较测试,看看爆米花产量是否在对爆米花品牌(列)之间不同。

c = multcompare(统计)
注意:您的模型包含一个交互术语。当模型包含交互作用时,主效应的测试可能很难解释。

图列的多重比较包含一个轴。标题轴单击你想要测试的组包含7个类型线的对象。

c =3×61.0000 2.0000 0.9260 1.5000 2.0740 0.0000 1.0000 3.0000 1.6760 2.2500 2.8240 0.0000 2.0000 3.0000 0.1760 0.7500 1.3240 0.0116

的前两列c显示比较的组。第四列显示了估计组均值之间的差异。第三和第五列显示了真实均值差的95%置信区间的下限和上限。第六列包含p对应的均值差等于零的假设检验的值。所有p-values(0,0,和0.0116)非常小,这表明所有三个品牌的爆米花产量不同。

图中显示了平均数的多重比较。默认情况下,组1的平均值是突出显示的,比较间隔是蓝色的。因为其他两组的比较间隔与组1的平均值的间隔不相交,所以用红色突出显示。缺乏交集表明两组平均值都不同于第一组平均值。选择其他组均值以确认所有组均值之间存在显著差异。

执行多重比较测试,以查看两种popper类型(行)之间的爆米花产量差异。

c = multcompare(统计数据,“估计”“行”
注意:您的模型包含一个交互术语。当模型包含交互作用时,主效应的测试可能很难解释。

图行均值的多重比较包含一个轴。标题轴单击你想要测试的组包含5个类型线的对象。

c =1×61.0000 -1.3828 -1.0000 -0.6172 0.0001

p-值0.0001表示两种爆米花类型(空气和油)的爆米花产率不同。图中显示了相同的结果。不相交的比较区间表明各组平均值之间存在显著差异。

加载示例数据。

Y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';G1 = [1 2 1 2 1 2];g2 = {“嗨”“嗨”“罗”“罗”“嗨”“嗨”“罗”“罗”};g3 = {“可能”“可能”“可能”“可能”“6月”“6月”“6月”“6月”};

y是响应向量和吗g1g2,g3为分组变量(因素)。每一个因素都有两个层次,每一个观察y是由因素水平的组合来确定的。例如,观察y (1)与第一级因子有关吗g1、水平“嗨”的因素g2,和水平“可能”的因素g3.同样,观察y (6)与2级因子有关吗g1、水平“嗨”的因素g2,和水平“6月”的因素g3

测试所有因素水平的响应是否相同。还要计算多个比较测试所需的统计数据。

[~,~,stats] = anovan(y,{g1 g2 g3}),“模型”“互动”...“varnames”, {g1的“g2”“g3”});

图N-Way ANOVA包含uicontrol类型的对象。

p-值为0.2578表示水平的平均响应“可能”“6月”的因素g3并没有显著的不同。的p-value为0.0347表示水平的平均响应12的因素g1是明显不同的。类似地,p-值0.0048表示水平的平均响应“嗨”“罗”的因素g2是明显不同的。

执行多个比较测试以找出哪些因素组g1g2是明显不同的。

结果= multcompare(统计,“维度”[1, 2])

图总体边际均值多重比较包含一个坐标轴。标题轴单击要测试的组包含9个类型为line的对象。

结果=6×61.0000 2.0000 -6.8604 -4.4000 -1.9396 0.0272 1.0000 3.0000 4.4896 6.9500 9.4104 0.0170 1.0000 4.0000 6.1396 8.6000 11.0604 0.0136 2.0000 3.0000 8.8896 11.3500 13.8104 0.0101 2.0000 4.0000 10.5396 13.0000 15.4604 0.0087 3.0000 4.0000 -0.8104 1.6500 4.1104 0.0737

multcompare比较两个分组变量的组(水平)的组合,g1g2.在结果矩阵中,数字1对应的组合电平1g1和水平g2,数字2对应水平的组合2g1和水平g2.同样,数字3对应的是level的组合1g1和水平g2,数字4对应level的组合2g1和水平g2.矩阵的最后一列包含p值。

例如,矩阵的第一行表示等级的组合1g1和水平g2是否与水平组合具有相同的平均响应值2g1和水平g2.的p-值为0.0280,说明平均响应差异显著。你也可以在图中看到这个结果。蓝条显示了水平组合的平均响应的比较区间1g1和水平g2.红色条是其他组组合的平均反应的比较区间。红色条与蓝色条没有重叠,这意味着水平组合的平均响应1g1和水平g2与其他组组合的平均反应有显著差异。

您可以通过单击该组对应的比较间隔来测试其他组。你点击的栏变成蓝色。显著不同的组的条形图是红色的。没有显著差异的组的条形图是灰色的。例如,如果您单击级别组合的比较间隔1g1和水平g2,比较间隔为组合电平2g1和水平g2重叠,因此是灰色的。相反,其他比较区间为红色,表示差异显著。

输入参数

全部折叠

测试数据,指定为结构。你可以使用以下函数之一创建一个结构:

multcompare不支持多重比较使用金宝appanovan包含随机或嵌套效应的模型的输出。随机效应模型的计算产生一个警告,即所有效应都被视为固定的。不接受嵌套模型。

数据类型:结构体

名称-值对的观点

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“阿尔法”,0.01,“CType”、“bonferroni”,“显示”,“关闭”计算Bonferroni临界值,在1%显著性水平下进行假设检验,省略交互显示。

多重比较检验的显著性水平,指定为逗号分隔对组成“α”和范围(0,1)的标量值。指定的值“α”决定了100 × (1 - α)矩阵中返回的区间的置信水平c在图中。

例子:“阿尔法”,0.01

数据类型:|

要用于多重比较的临界值的类型,指定为由“CType”下面是其中之一。

价值 描述
“tukey-kramer”“hsd”

杜克的诚实显著性差异标准

“bonferroni”

Bonferroni方法

“dunn-sidak”

邓恩和Sidák的方法

“迷幻药”

费雪最小显著差法

“矫正”

菸害的年代过程

例子:“CType”、“bonferroni”

显示开关,指定为逗号分隔对组成“显示”,要么“上”“关闭”.如果您指定“上”,然后multcompare显示一个图表的估计和他们的比较间隔。如果您指定“关闭”,然后multcompare省略了图。

例子:“显示”,“关闭”

指定用于计算总体边际均值的一个或多个维度的向量,指定为正整数值或由这些值组成的向量。使用“维度”仅在创建输入结构时才使用名称-值对统计数据使用函数anovan

例如,如果指定“维度”作为1,然后multcompare比较第一个分组变量的每个值的平均值,并通过去除其他分组变量的影响进行调整,就好像设计是平衡的一样。如果您指定“维度”作为(1、3),然后multcompare计算第一组和第三组变量的每个组合的总体边际均值,去除第二组变量的影响。如果你拟合一个奇异模型,一些单元均值可能是不可估计的,任何依赖于这些单元均值的总体边际均值都将有值

人口边际均值由Milliken和Johnson(1992)以及Searle、Speed和Milliken(1980)描述。人口边际均值背后的思想是通过固定指定的因素的值来消除不平衡设计的任何影响“维度”,并平均出其他因素的影响,就好像每个因素组合出现的次数相同。人口边际均值的定义不依赖于每个因素组合的观测数。对于每个因素组合的观测数没有意义的设计实验,总体边际均值比忽略其他因素的简单均值更容易解释。对于调查和其他研究来说,在每个组合中观察到的数量确实有意义,人口边际均值可能更难解释。

例子:“维度”,[1,3]

数据类型:|

要比较的估计值,指定为逗号分隔的对,由“估计”和一个允许值。的允许值“估计”取决于用于生成输入结构的函数统计数据,根据下表。

anova1

一个也没有。这个名称-值对被忽略,并且multcompare总是比较群体的方式。

anova2

要么“列”比较列的意思,或“行”比较行的意思。

anovan

一个也没有。这个名称-值对被忽略,并且multcompare总是比较总体边际均值“维度”名称-值对的论点。

aoctool

要么“坡”“拦截”,或“pmm”分别比较斜率、截距或人口边际平均值。如果协方差模型的分析不包括单独的斜率,那么“坡”是不允许的。如果它不包含单独的拦截,那么就不可能进行比较。

弗里德曼

一个也没有。这个名称-值对被忽略,并且multcompare总是比较平均列排名。

kruskalwallis

一个也没有。这个名称-值对被忽略,并且multcompare总是比较平均组的排名。

例子:“估计”、“行”

输出参数

全部折叠

矩阵的多个比较结果,返回为p标量值的- × 6矩阵,其中p为组对的数目。矩阵的每一行都包含一对比较检验的结果。第1和2列包含两个样品的比较指标。列3包含低置信区间,列4包含估计,列5包含高置信区间。第6列包含p对应的均值差不等于0的假设检验的值。

例如,假设一行包含以下条目。

2.0000 5.0000 1.9442 8.2206 14.4971 0.0432

这些数字表明,第2组的均值减去第5组的均值估计为8.2206,平均值真差的95%置信区间为[1.9442,14.4971]。的p-值对应的假设检验,组2和组5的均值与零的差异显著为0.0432。

在本例中,置信区间不包含0,因此在5%显著性水平上差异显著。如果置信区间包含0,则差异不显著。的p-值为0.0432,也说明2组和5组的均值差值与0有显著差异。

估计值的矩阵,作为标量值的矩阵返回。第一列包含每组平均值(或正在比较的任何统计数据)的估价值,第二列包含它们的标准误差。

包含交互图的图形的句柄,作为句柄返回。这个图的标题包含了与图交互的指令,以及x-axis标签包含哪些平均值与所选平均值显著不同的信息。如果您计划使用此图表进行演示,您可能希望省略标题和x设在标签。您可以使用图形窗口的交互特性删除它们,也可以使用以下命令。

标题('')包含(''

组名,作为字符向量的单元格数组返回。每一行的gnames包含组的名称。

更多关于

全部折叠

多重比较测试

方差分析比较了几个组的均值,以检验它们都是相等的假设,与它们不都相等的一般备选方案。有时这种选择可能过于笼统。您可能需要了解哪些对平均值显著不同,哪些则没有。一个多重比较检验可以提供这些信息。

当你执行一个简单的t-测试一组平均值对另一组平均值,则指定一个显著性水平,该显著性水平决定临界值t统计。例如,可以指定值α0.05确保在没有实际差异的情况下,错误地发现显著差异的概率不超过5%。当有许多组的方法时,也有许多对进行比较。如果你申请的是普通的t在这种情况下,测试α值将应用于每次比较,因此错误地发现显著差异的几率将随着比较次数的增加而增加。多重比较程序被设计来提供一个概率的上界任何比较会被错误地发现有意义。

参考文献

Hochberg Y.和a.c. Tamhane。多重比较过程.霍博肯:约翰·威利父子公司,1987。

g。A。和d。e。Johnson。凌乱数据分析,第I卷:设计实验.佛罗里达州博卡拉顿:查普曼和霍尔/CRC出版社,1992年。

瑟尔,s.r., F. M.斯毕德,g.a.米利肯。线性模型中的人口边际均值:最小二乘均值的另一种选择美国统计学家.1980年,页216 - 221。

之前介绍过的R2006a