主要内容

假设检验

假设检验是一种基于样本的统计证据对总体进行推断的常用方法。

举个例子,假设有人说,在马萨诸塞州的某一特定时间,一加仑普通无铅汽油的平均价格是1.15美元。你如何确定这句话的真实性?你可以试着找到当时该州每个加油站的价格。这种方法将是确定的,但它可能耗时、昂贵,甚至不可能。

一个更简单的方法是在全州随机选择的少量加油站找到价格,然后计算样本平均值。

由于选择过程中的机会可变性,样本平均值彼此不同。假设样本平均值是1.18美元。0.03美元的差价是随机抽样的产物,还是一加仑汽油的平均价格实际上大于1.15美元的重要证据?假设检验是做出这类决定的一种统计方法。

这个例子展示了如何使用假设检验来分析马萨诸塞州两个月内测量的汽油价格。

本例使用文件中的汽油价格数据gas.mat.该文件包含了1993年马萨诸塞州周围每加仑汽油价格的两个随机样本。第一个样本,price1其中包含了该州1月份某一天的20次随机观测。第二个样本,price2,包含了一个月后对该州的20次随机观测。

负载气体价格= [price1 price2];

作为第一步,你可能想要测试样本来自正态分布的假设。一个正常的概率图可以让你快速了解。

normplot(价格)

图中包含一个轴对象。标题为Normal Probability Plot的axis对象包含6个类型为line的对象。

两个散射点在样本的第一和第三四分位数上近似地遵循直线,表明近似的正态分布。2月份的样本(右行)显示下尾略微偏离正常。从1月到2月的平均值变化是明显的。假设检验用于量化正态性检验。由于每个样本相对较小,建议使用Lilliefors测试。

lillietest (price1)
Ans = 0
lillietest (price2)
Ans = 0

的默认显著性级别lillietest是5%。每个测试返回的逻辑0表示无法拒绝样本正态分布的原假设。这种失败可能反映了总体的常态,也可能反映了由于样本量小而缺乏反对零假设的有力证据。

现在计算样本均值。

Sample_means =均值(价格)
sample_means =1×2115.1500 - 118.5000

你可能想检验零假设,即1月份样本当天全州的平均价格为1.15美元。如果你知道整个州的价格标准偏差在历史上一直是0.04美元,那么az-test是合适的。

[h,pvalue,ci] = ztest(price1/100,1.15,0.04)
H = 0
Pvalue = 0.8668
ci =2×11.1340 - 1.1690

逻辑输出h= 0表示在默认显著性水平5%的情况下未能拒绝原假设。这是零假设下高概率的结果,由p价值,观察一个价值为极端或更极端的z-从样本中计算的统计量。均值的95%置信区间[1.1340 - 1.1690]包括了1.15美元的假设总体均值。

后一个样本是否提供了更有力的证据来拒绝2月份全州平均价格为1.15美元的零假设?概率图中显示的偏移和计算样本均值的差异表明了这一点。这一变化可能表明市场出现了重大波动,从而对使用历史标准差的有效性提出了质疑。如果不能假设已知的标准偏差,则at-test更合适。

[h,pvalue,ci] = ttest(price2/100,1.15)
H = 1
Pvalue = 4.9517e-04
ci =2×11.1675 - 1.2025

逻辑输出h= 1表示在默认显著性水平5%下拒绝原假设。在这种情况下,均值的95%置信区间不包括假设的总体均值1.15美元。

你可能想要更仔细地调查一下价格的变化。这个函数ttest2检验两个独立样本是否来自具有相等但未知的标准差和相同均值的正态分布,与均值不相等的替代情况。

[h,sig,ci] = ttest2(price1,price2)
H = 1
Sig = 0.0083
ci =2×1-5.7845 - -0.9155

原假设在默认的5%显著性水平下被拒绝,均值差的置信区间不包括假设值0。有缺口的箱形图是另一种可视化移位的方法。

箱线图(价格,1)h = gca;h.XTick = [1 2];h.XTickLabel = {“1月”“2”};包含(“月”) ylabel (的价格($ 0.01)

图中包含一个轴对象。axis对象包含14个line类型的对象。

该图显示了样本在中位数附近的分布。计算每个方框中缺口的高度,以便当它们的中位数在默认的5%显著性水平上不同时,并排的方框具有不重叠的缺口。计算是基于数据正态性的假设,但对其他分布的比较是相当稳健的。并排的图提供了一种可视化的假设检验,比较中位数而不是平均值。上面的图似乎几乎不拒绝中位数相等的零假设。

非参数Wilcoxon秩和检验,由函数实现ranksum,可用于量化等中位数检验。它测试两个独立的样本是否来自相同的连续(不一定是正态)分布,具有相等的中位数,而不是它们没有相等的中位数。

[p,h] = ranksum(price1,price2)
P = 0.0095
h =逻辑1

该检验在默认的5%显著性水平上拒绝相等中位数的原假设。

另请参阅

|||||

相关的话题