主要内容

anova2

双向方差分析

描述

anova2采用平衡设计进行双向方差分析(ANOVA)。要使用不平衡设计进行双向方差分析,请参见anovan

例子

p= anova2 (y代表返回p中两个或两个以上列和两个或两个以上行观测值的平均数进行比较的平衡双向方差分析的值y

代表为每个因子组组合的重复数,该数必须为常数,表示均衡设计。对于不平衡的设计,使用anovan.的anova2函数测试列和行因子的主要效果及其交互效果。为了测试相互作用的效果,代表必须大于1。

anova2还显示标准ANOVA表。

例子

p= anova2 (y代表displayopt启用ANOVA表显示时displayopt“上”(默认值)并抑制显示displayopt“关闭”

例子

p资源描述) = anova2 (___返回单元格数组中的ANOVA表(包括列和行标签)资源描述.若要将ANOVA表的文本版本复制到剪贴板,请选择编辑>拷贝文本菜单。

例子

p资源描述统计数据) = anova2 (___返回一个统计数据结构,您可以使用该结构执行多重比较检验.多重比较检验使您能够确定哪一对组的平均数有显著差异。要执行此测试,请使用multcompare,提供了统计数据结构作为输入。

例子

全部折叠

加载样例数据。

负载爆米花爆米花
爆米花=6×35.5000 4.5000 3.5000 5.5000 4.5000 4.0000 6.0000 4.0000 3.0000 6.5000 5.0000 4.0000 7.0000 5.5000 5.0000 7.0000 5.000 4.5000

数据来自一项关于爆米花品牌和类型的研究(Hogg 1987)。矩阵的列爆米花分别是品牌,美食家,国家和通用。排的是popper类型,油和空气。在这项研究中,研究人员用每个爆米花机把每个牌子的巧克力都爆三次,也就是说,重复的次数是3次。前三行对应油爆器,后三行对应空气爆器。响应值是爆米花的产量。

进行双向方差分析。在单元格数组中保存ANOVA表资源描述方便获取结果。

[p(资源]= anova2(爆米花,3);

图双向方差分析包含uicontrol类型的对象。

概率F >显示了p-三个品牌的爆米花(0.0000)、两种爆米花类型(0.0001)以及品牌与爆米花类型之间的相互作用(0.7462)的值。这些数值表明,爆米花品牌和爆米花机类型影响爆米花产量,但没有证据表明两者之间存在交互作用。

显示包含ANOVA表的单元格数组。

资源描述
台=6×6单元阵列列1到5{‘源’}{“党卫军”}{“df”}{‘女士’}{' F '}{“列”}{[15.7500]}{[2]}{[7.8750]}{[56.7000]}{‘行’}{[4.5000]}{[1]}{[4.5000]}{[32.4000]}{‘互动’}{[0.0833]}{[2]}{[0.0417]}{[0.3000]}{‘错误’}{[1.6667]}{[12]}{[0.1389]}{0 x0双}{“总”}{[22]}{[17]}{0 x0双}{0 x0双}列6{遇到的问题> F '} {[7.6790 e-07]} {[1.0037 e-04]} {[0.7462]} {0 x0双}{0 x0双}

存储F-独立变量中因素和因素相互作用的统计量。

Fbrands =台{2、5}
Fbrands = 56.7000
Fpoppertype =台{3、5}
Fpoppertype = 32.4000
Finteraction =台{4、5}
Finteraction = 0.3000

加载样例数据。

负载爆米花爆米花
爆米花=6×35.5000 4.5000 3.5000 5.5000 4.5000 4.0000 6.0000 4.0000 3.0000 6.5000 5.0000 4.0000 7.0000 5.5000 5.0000 7.0000 5.000 4.5000

数据来自一项关于爆米花品牌和类型的研究(Hogg 1987)。矩阵的列爆米花是品牌(美食家,国家和通用)。排的是popper类型的油和空气。前三行对应油爆器,后三行对应空气爆器。在这项研究中,研究人员用每个爆米花机将每个牌子的巧克力分别爆开三次。这些值是爆米花的产量。

进行双向方差分析。还要计算对主要效果执行多重比较测试所需的统计数据。

[~, ~,统计]= anova2(爆米花,3,“关闭”
统计=结构体字段:来源:'anova ' sigmasq: 0.1389 colmeans: [6.2500 4.7500 4] colmeans: 6 rowmeans: [4.5000 5.5000] rowwn: 9 inter: 1 pval: 0.7462 df: 12

统计数据结构包括

  • 均方误差(sigmasq

  • 每种爆米花品牌的平均产量估计(colmeans

  • 每个爆米花品牌的观察数量(coln

  • 估计每种罂粟品种的平均产量(rowmeans

  • 每种popper类型的观察数(地区

  • 交互次数(国际米兰

  • p-值,显示交互项的显著性水平(pval

  • 误差自由度(df).

执行多重比较测试,看看爆米花的产量是否在成对的爆米花品牌(列)之间不同。

c1 = multcompare(统计);
注意:您的模型包括一个交互项。当模型包含相互作用时,对主要效应的测试可能很难解释。

图列均值的多重比较包含一个坐标轴对象。单击要测试的组的带有标题的axes对象包含7个类型为line的对象。

该图显示了平均数的多次比较。默认情况下,组1的平均值高亮显示,比较间隔为蓝色。因为其他两组的比较区间与第1组的均值区间不相交,所以用红色突出显示。这种缺乏交集的情况表明两组均值都不同于第一组均值。选择其他组均值,确认所有组均值之间有显著差异。

在表格中显示多个比较结果。

tbl1 = array2table (c1,“VariableNames”...“组”“B组”“下限”“a - b”“上限”“假定值”])
tbl1 =3×6表A组B组下限A - B假定值上限  _______ _______ ___________ ____ ___________ __________ 1 2 0.92597 1.5 2.074 4.1188 e-05 1 3 e-07 2 3 0.17597 0.75 1.324 6.1588 1.676 2.25 2.824 0.011591

的前两列c1显示被比较的组。第四列显示估计的组均值之间的差异。第三和第五列显示了真实平均差的95%置信区间的下限和上限。第六列包含p-值表示对应的均值差等于零的假设检验。所有p的值非常小,这表明三个品牌的爆米花产量是不同的。

执行多重比较测试,以查看两种爆米花类型(行)之间的爆米花产量差异。

c2 = multcompare(统计,“估计”“行”);
注意:您的模型包括一个交互项。当模型包含相互作用时,对主要效应的测试可能很难解释。

图行均值的多重比较包含一个坐标轴对象。单击要测试的组的带有标题的axes对象包含5个类型为line的对象。

tbl2 = array2table (c2,“VariableNames”...“组”“B组”“下限”“a - b”“上限”“假定值”])
tbl2 =1×6表A组B组下限A - B假定值上限  _______ _______ ___________ ___ ___________ __________ 1 2 1 -0.61722 0.00010037 -1.3828

p-value表示两种爆米花类型(空气和油)的爆米花产量不同。图中显示了相同的结果。不相交的比较区间表明组均值之间存在显著差异。

输入参数

全部折叠

示例数据,指定为矩阵。列对应一个因子的组,行对应另一个因子和复制的组。复制是对行和列因子的每组(水平)组合的测量或观察。例如,在下面的数据中,行因子一个有三层,列因子B有两个级别,有两个复制(代表= 2).下标分别表示行、列和复制。

B 1 B 2 y 111 y 121 y 112 y 122 y 211 y 221 y 212 y 222 y 311 y 321 y 312 y 322 一个 1 一个 2 一个 3.

数据类型:|

每个组的组合的复制数,指定为整数。例如,以下数据有两个复制(代表= 2)为每组行因子组合一个和列因素B

B 1 B 2 y 111 y 121 y 112 y 122 y 211 y 221 y 212 y 222 y 311 y 321 y 312 y 322 一个 1 一个 2 一个 3.

  • 代表1(默认),anova2返回两个p值的向量p

    • p-value为零假设,所有的样本来自因子B(即,中的所有列样本y)都来自相同的人群。

    • p-value为零假设,即所有样本来自因子一个(即,中的所有行样本y)都来自相同的人群。

  • 代表大于1anova2还返回p-value为因子的零假设一个而且B没有相互作用(即,由于因素的影响一个而且B添加剂).

例子:p =方差分析(y, 3)指定组(级别)的每个组合有三个复制。

数据类型:|

指示将ANOVA表显示为图形,指定为“上”“关闭”

输出参数

全部折叠

p价值的F-test,作为标量值返回。一个小p-value表示结果具有统计学意义。一般显著性水平为0.05或0.01。例如:

  • 一个足够小的p-value为行因子组均值的零假设一个表明至少有一个行样本均值与另一个行样本均值显著不同;也就是说,有一个主要的影响因素一个

  • 一个足够小的p-value为组(水平)列因子均值的零假设B表明至少有一个列样本均值与另一个列样本均值显著不同;也就是说,有一个主要的影响因素B

  • 一个足够小的p-因子组(级别)的组合值一个而且B说明因素之间存在相互作用一个而且B

ANOVA表,作为单元格数组返回。资源描述有六列。

列名 定义
可变性的来源。
党卫军 每个源的平方和。
df 与每个源相关联的自由度。
女士 每个源的均方,也就是比值SS / df
F F-statistic,即均方之比。
概率F > p的概率F-statistic的值可以大于test-statistic的计算值。anova2从CDF中得到这个概率F分布。

ANOVA表的行显示了数据的可变性,根据的值将数据分为三或四部分代表

定义
由于列均值之间的差异而产生的变异性
由于行均值之间的差异而产生的变异性
交互

由于行和列之间的相互作用(如果代表大于其默认值1)

错误 剩余的可变性没有任何系统的来源来解释

数据类型:细胞

统计数据多个比较测试,作为结构返回。使用multcompare执行多个比较测试,提供统计数据作为输入参数。统计数据有九个字段。

定义
的来源统计数据输出
sigmasq 均方误差
colmeans 列均值的估计值
coln 每一组的观察数列
rowmeans 行均值的估计值
地区 每一组的观察数
国际米兰 的相互作用
pval p-value为交互项
df 误差自由度(代表- 1) *rc在哪里代表复制的数量和c而且r分别为因子中的组数。

数据类型:结构体

参考文献

霍格,R. V.和J.莱多特。工程数据.纽约:麦克米伦,1987年。

版本历史

之前介绍过的R2006a