主要内容

multcompare

多重比较测验

描述

例子

c= multcompare (统计数据返回一个矩阵c中所含信息的多重比较检验的成对比较结果统计数据结构。multcompare还显示估计和比较间隔的交互式图形。每组均值由一个符号表示,间隔由从符号延伸出来的一条线表示。区间不相交时,两组均值有显著差异;如果它们的区间重叠,它们就没有显著不同。如果您使用鼠标选择任何组,那么该图将突出显示所有其他显著不同的组(如果有的话)。

例子

c= multcompare (统计数据名称,值返回成对比较结果的矩阵,c,使用一个或多个指定的附加选项名称,值对参数。例如,您可以指定置信区间,或者在多重比较中使用的临界值类型。

c= multicompare (___也返回一个矩阵,,其中包含每个组的平均值(或正在比较的任何统计数据)的估计值和相应的标准误差。您可以使用前面的任何语法。

ch= multicompare (___也返回一个句柄,h,到比较图。

例子

chgnames= multicompare (___也返回一个单元格数组,gnames,其中包含组的名称。

例子

全部折叠

加载样例数据。

负载carsmall

执行单向方差分析(ANOVA),以查看汽车的里程数之间是否有任何差异。

[p,t,stats] = anova1(MPG,Origin,“关闭”);

执行组均值的多重比较。

[c,m,h,nms] = multcompare(stats);

图多重均值比较包含一个坐标轴对象。带有标题的axes对象单击要测试的组,该组包含13个类型为line的对象。

multcompare显示估算值及其周围的比较间隔。您可以点击每个国家的图表,将其平均值与其他国家的平均值进行比较。

现在显示具有相应组名的平均估计值和标准误差。

(nms num2cell (m))
ans =6×3单元格数组{'美国'}{[21.1328]}{[0.8814]}{‘日本’}{[31.8000]}{[1.8206]}{“德国”}{[28.4444]}{[2.3504]}{“法国”}{[23.6667]}{[4.0711]}{“瑞典”}{[22.5000]}{[4.9860]}{“意大利”}{[28]}{[7.0513]}

加载样例数据。

负载爆米花爆米花
爆米花=6×35.5000 4.5000 3.5000 5.5000 4.5000 4.000 6.0000 4.0000 3.0000 6.5000 5.0000 4.0000 7.0000 5.5000 5.0000 7.0000 5.0000 4.5000

数据来自一项关于爆米花品牌和爆米花机类型的研究(Hogg 1987)。矩阵的列爆米花是品牌(Gourmet, National和Generic)。排是popper类型的油和空气。在这项研究中,研究人员用每个爆破器将每个品牌的啤酒爆破三次。数值是每杯爆米花的产量。

进行双向方差分析。还要计算对主要效果执行多重比较测试所需的统计数据。

[~,~,stats] = anova2(爆米花,3,“关闭”
统计=带字段的结构:来源:'anova2' sigmasq: 0.1389 colmean: [6.2500 4.7500 4] colmean: [4.5000 5.5000] rowmean: 9 inter: 1 pval: 0.7462 df: 12

统计数据结构包括

  • 均方误差(sigmasq

  • 每个爆米花品牌的平均产量估计(colmeans

  • 每个爆米花品牌的观察次数(coln

  • 每种花椒品种的平均产量估计数(rowmeans

  • 每种popper类型的观测数(地区

  • 交互次数(国际米兰

  • p-值,表示交互项的显著性水平(pval

  • 误差自由度(df).

执行多重比较测试,以查看爆米花品牌对(列)之间的爆米花产量是否不同。

C = multicompare (stats)
注意:您的模型包含一个交互项。当模型包含相互作用时,主效应的测试可能难以解释。

图列均值的多重比较包含一个坐标轴对象。带有标题的axes对象单击要测试的组,该组包含7个类型为line的对象。

c =3×61.0000 2.0000 0.9260 1.5000 2.0740 0.0000 1.0000 3.0000 1.6760 2.2500 2.8240 0.000 2.0000 3.0000 0.1760 0.7500 1.3240 0.0116

的前两列c显示被比较的组。第四列显示估计的组均值之间的差值。第三和第五列显示了真实平均差的95%置信区间的下限和上限。第六列包含p-value为假设检验,对应的平均差等于零。所有p-values(0, 0,和0.0116)非常小,这表明三个品牌的爆米花产量不同。

图中显示了平均数的多重比较。默认情况下,组1的平均值高亮显示,比较间隔显示为蓝色。因为其他两组的比较区间与第1组的均值区间不相交,所以用红色突出显示。这种缺乏交集的情况表明,两组均值都不同于第1组均值。选择其他组均值,确认所有组均值之间存在显著差异。

执行多重比较测试,以查看两种爆米花类型(行)之间的爆米花产量差异。

C = multicompare (stats,“估计”“行”
注意:您的模型包含一个交互项。当模型包含相互作用时,主效应的测试可能难以解释。

图行均值的多重比较包含一个坐标轴对象。带有标题的axes对象单击要测试的组,该组包含5个类型为line的对象。

c =1×61.0000 2.0000 -1.3828 -1.0000 -0.6172 0.0001

p-value为0.0001表示两种爆米花机(空气和油)的爆米花产量不同。图中显示了相同的结果。不相交的比较区间表明组均值之间存在显著差异。

加载样例数据。

Y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';G1 = [1 2 1 2 1 2 1 2 2];G2 = {“嗨”“嗨”“罗”“罗”“嗨”“嗨”“罗”“罗”};G3 = {“可能”“可能”“可能”“可能”“6月”“6月”“6月”“6月”};

y响应向量是和吗g1g2,g3是分组变量(因子)。每个因素都有两个层次,每个观察都在y由因素级别的组合标识。例如,观察y (1)与因子的第一级有关吗g1、水平“嗨”的因素g2,和水平“可能”的因素g3.同样,观察y (6)与因子的2级有关吗g1、水平“嗨”的因素g2,和水平“6月”的因素g3

测试所有因素水平的响应是否相同。还要计算多个比较测试所需的统计数据。

[~,~,stats] = anovan(y,{g1 g2 g3},“模型”“互动”...“varnames”, {g1的“g2”“g3”});

图N-Way ANOVA包含uicontrol类型的对象。

p-value为0.2578表示各水平的平均响应“可能”而且“6月”的因素g3没有明显的不同。的p-value为0.0347表示各水平的平均响应1而且2的因素g1有很大的不同。类似地,p-value为0.0048表示水平的平均响应“嗨”而且“罗”的因素g2有很大的不同。

执行多次比较测试以找出哪些组因素g1而且g2有很大的不同。

结果= multicompare (stats,“维度”[1, 2])

图总体边际均值的多重比较包含一个轴对象。带有标题的axes对象单击要测试的组,其中包含9个类型为line的对象。

结果=6×61.0000 2.0000 -6.8604 -4.4000 -1.9396 0.0272 1.0000 3.0000 4.4896 6.9500 9.4104 0.0170 1.0000 4.1396 8.6000 11.0604 0.0136 2.0000 3.0000 8.8896 11.3500 13.8104 0.0101 2.0000 4.0000 10.5396 13.0000 15.4604 0.0087 3.0000 4.0000 -0.8104 1.6500 4.1104 0.0737

multcompare比较两个分组变量的组(级)组合,g1而且g2.在结果矩阵中,数字1对应的是级别的组合1g1和水平g2,数字2对应等级的组合2g1和水平g2.同样,数字3对应的是等级的组合1g1和水平g2,数字4对应等级的组合2g1和水平g2.矩阵的最后一列包含p值。

例如,矩阵的第一行表示组合水平1g1和水平g2是否与水平组合的平均响应值相同2g1和水平g2.的p-value为0.0280,表示平均响应有显著差异。您还可以在图中看到这个结果。蓝色条显示了水平组合的平均响应的比较区间1g1和水平g2.红色条是其他组组合的平均响应的比较区间。红条与蓝条没有重叠,这表示水平组合的平均响应1g1和水平g2与其他组组合的平均反应显著不同。

您可以通过单击该组对应的比较间隔来测试其他组。你点击的栏变成蓝色。有显著差异的组的柱状图是红色的。没有显著差异的组的柱状图是灰色的。例如,如果您点击比较区间的组合级别1g1和水平g2,为组合级别的比较区间2g1和水平g2重叠,因此是灰色的。相反,其他比较区间为红色,表示差异显著。

输入参数

全部折叠

测试数据,指定为结构。您可以使用以下函数之一创建结构:

multcompare不支持多重比较使用金宝appanovan包含随机或嵌套效果的模型的输出。随机效应模型的计算产生一个警告,即所有效应都被视为固定的。不接受嵌套模型。

数据类型:结构体

名称-值参数

的可选逗号分隔对名称,值参数。的名字参数名称和价值对应的值。的名字必须出现在引号内。您可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“阿尔法”,0.01,“CType”、“bonferroni”,“显示”,“关闭”计算Bonferroni临界值,在1%显著性水平下进行假设检验,并省略交互显示。

多重比较检验的显著性水平,指定为由逗号分隔的对组成“α”和范围(0,1)中的标量值。为指定的值。“α”决定了100 × (1 - α)矩阵中返回的区间的置信水平c在图中。

例子:“阿尔法”,0.01

数据类型:|

用于多重比较的临界值类型,指定为逗号分隔的对,由“CType”下面是其中之一。

价值 描述
“tukey-kramer”“hsd”

Tukey诚实显著差异准则

“bonferroni”

Bonferroni方法

“dunn-sidak”

邓恩和Sidák的方法

“迷幻药”

费雪最小差分法

“矫正”

Scheffé的s过程

例子:“CType”、“bonferroni”

显示切换,指定为逗号分隔的对,由“显示”,要么“上”“关闭”.如果你指定“上”,然后multcompare显示估算值及其比较间隔的图形。如果你指定“关闭”,然后multcompare省略图表。

例子:“显示”,“关闭”

一个或多个维度的向量,用于计算总体边际均值,用正整数值表示,或这些值的向量使用“维度”仅在创建输入结构时使用名称-值对统计数据使用函数anovan

例如,如果您指定“维度”作为1,然后multcompare比较第一个分组变量的每个值的平均值,通过删除其他分组变量的影响进行调整,就像设计是平衡的一样。如果你指定“维度”作为(1、3),然后multcompare计算第一个和第三个分组变量的每个组合的总体边际均值,去除第二个分组变量的影响。如果你拟合一个奇异模型,一些单元均值可能是不可估计的,任何依赖于这些单元均值的总体边际均值都有价值

人口边际均值由Milliken和Johnson(1992)和Searle、Speed和Milliken(1980)描述。总体边际均值背后的思想是通过固定所指定的因素的值来消除不平衡设计的任何影响“维度”,并平均其他因素的影响,就好像每个因素组合出现相同的次数一样。总体边际均值的定义不依赖于每个因素组合的观察数。对于设计好的实验,在每个因素组合下的观察数没有意义,总体边际均值比忽略其他因素的简单均值更容易解释。对于调查和其他研究,每个组合的观察数量确实有意义,总体边际均值可能更难解释。

例子:“维度”,[1,3]

数据类型:|

要比较的估计值,指定为逗号分隔的对,由“估计”和一个允许值。的允许值“估计”取决于用于生成输入结构的函数统计数据,根据下表。

anova1

一个也没有。这个名称-值对将被忽略,并且multcompare总是比较组均值。

anova2

要么“列”比较列意味着,或者“行”比较行均值。

anovan

一个也没有。这个名称-值对将被忽略,并且multcompare总是比较由。所指定的总体边际均值“维度”名称-值对参数。

aoctool

要么“坡”“拦截”,或“pmm”分别比较斜率、截距或总体边际均值。如果协方差模型的分析不包括单独的斜率,则“坡”是不允许的。如果它不包括单独的拦截,那么就不可能进行比较。

弗里德曼

一个也没有。这个名称-值对将被忽略,并且multcompare总是比较平均列排名。

kruskalwallis

一个也没有。这个名称-值对将被忽略,并且multcompare总是比较平均组排名。

例子:“估计”、“行”

输出参数

全部折叠

矩阵的多个比较结果,返回作为一个p-by-6矩阵的标量值,其中p是组的成对数。矩阵的每一行包含一个配对比较测试的结果。列1和列2包含两个被比较样本的指标。第3列包含低置信区间,第4列包含估计值,第5列包含高置信区间。第6列包含p-value表示对应的均值差不等于0的假设检验。

例如,假设一行包含以下条目。

2.0000 5.0000 1.9442 8.2206 14.4971 0.0432

这些数字表明,第2组的均值减去第5组的均值估计为8.2206,均值真实差值的95%置信区间为[1.9442,14.4971]。的p-value对应的假设检验2组和5组的均值差异显著于零为0.0432。

在这个例子中,置信区间不包含0,所以在5%的显著性水平上差异是显著的。如果置信区间确实包含0,则差异不显著。的p-value = 0.0432也说明2组和5组的均值与0的差值有显著性差异。

矩阵的估计,返回作为标量值的矩阵。的第一列包含每组的平均值(或正在比较的任何统计数据)的估计值,第二列包含它们的标准误差。

包含交互图的图形的句柄,作为句柄返回。该图的标题包含与该图交互的说明,以及x-axis标签包含关于哪些均值与所选均值显著不同的信息。如果您计划使用此图表进行表示,则可能需要省略标题和x设在标签。可以使用图形窗口的交互功能删除它们,也可以使用以下命令。

标题('')包含(''

组名,作为字符向量的单元格数组返回。每行gnames包含组的名称。

更多关于

全部折叠

多重比较测试

方差分析比较几个组的均值,以检验它们都相等的假设,以及它们都不相等的一般选择。有时这种选择可能过于笼统。您可能需要了解哪些对平均值显著不同,哪些不是。一个多重比较测验可以提供此信息。

当你执行一个简单t-测试一组的均值相对于另一组的均值,您指定一个显著性水平,以确定的截止值t统计。例如,您可以指定值α0.05为了确保当没有真正的差异时,您将错误地发现显著差异不超过5%。当有很多组均值时,也有很多对均值可供比较。如果你用一个普通的t-test在这种情况下α值将应用于每个比较,因此错误地发现显著差异的机会将随着比较的数量而增加。设计了多个比较程序,以提供概率的上限任何比较会被错误地认为是重要的。

参考文献

[1] Y. Hochberg和A. C. Tamhane。多重比较程序.霍博肯,新泽西州:约翰·威利父子,1987年。

[2]米利肯,G. A.和D. E.约翰逊。凌乱数据分析,第一卷:设计实验.佛罗里达州博卡拉顿:查普曼和霍尔/CRC出版社,1992年。

[3]塞尔,s。R。f。m。斯毕德,g。a。米利肯。线性模型中的总体边际均值:最小二乘均值的另一种选择。美国统计学家.1980,第216-221页。

R2006a之前介绍