主要内容

假设检验

假设检验是基于样本的统计证据对总体进行推断的常用方法。

举个例子,假如有人说,在马萨诸塞州的某个时间普通无铅汽油每加仑平均价格为$ 1.15。你怎么能确定的话是真的?你可以尝试在当时的状态,每一个加油站找到价格。这种做法将是决定性的,但它可能是耗时的,昂贵的,甚至是不可能的。

一种更简单的方法是在州内随机选择一小部分加油站的价格,然后计算样本平均值。

样本平均值彼此由于在选择过程中的变异几率不同。假设你的样本平均出来是$ 1.18是$ 0.03的差异随机抽样或显著的证据表明,一加仑汽油的平均价格实际上高于$ 1.15的神器?假设检验是做出此类决定的统计方法。

这个例子说明了如何使用假设检验来分析天然气价格在两个独立的跨月马萨诸塞州测量。

此示例使用文件中的天然气价格数据gas.mat.该文件包含了两份1993年马萨诸塞州附近每加仑汽油价格的随机样本。第一个样本,price1包含的单日一月各地州的20个随机观察。第二样品,price2,包含了一个月后在该州周围的20个随机观察结果。

加载气体price = [price1 price2];

作为第一步,你可能要测试的假设样本来自正态分布。正态概率图给出了一个快速的想法。

normplot(价格)

图包含轴对象。与标题正态概率图的轴对象包含类型的线6级的对象。

两个散点通过样本的第一和第三个四分位数近似地沿直线分布,表明近似正态分布。2月份的样本(右边那条线)显示了下尾与正常水平的轻微偏离。从1月到2月,平均值的变化是明显的。一个假设检验被用来量化正态检验。由于每个样本相对较小,建议进行Lilliefors测试。

lillietest(价格1)
ANS = 0
lillietest(price2)
ANS = 0

默认显着性水平lillietest是5%。每个测试返回的逻辑0表示拒绝样本是正态分布的零假设的失败。这种失败可能反映了总体的正态性,也可能反映了由于样本量小,对零假设缺乏强有力的证据。

现在计算样本均值。

sample_means =意味着(价格)
sample_means =1×2115.1500 - 118.5000

你可能想测试的零假设平均价格全州1月份的样品的一天是$ 1.15。如果你知道,在价格全州的标准偏差在历史上,始终,一直$ 0.04则Z.- 试验是合适的。

并[h,p值,CI] = ZTEST(价格1 / 100,1.15,0.04)
H = 0
p值= 0.8668
ci =2×11.1340 - 1.1690

逻辑输出H= 0表示失败拒绝在5%的默认显着性水平零假设。这是零假设下的高概率的结果,通过指示P.值,观察一个值作为极端或更极端的Z.t-统计从样品计算的。对平均[1.1340 1.1690]的95%置信区间包括$ 1.15假设总体平均值。

之后的样本是否提供了更有力的证据,来拒绝2月份全州平均价格为1.15美元的无效假设?概率图中显示的移位和计算样本均值的差异表明了这一点。这一变化可能表明市场出现了重大波动,从而引发了对使用历史标准偏差的有效性的质疑。如果不能假设一个已知的标准差,则aT.-test更合适。

(h, pvalue, ci) = tt (price2/100, 1.15)
H = 1
p值= 4.9517e-04
ci =2×11.1675 1.2025

逻辑输出H= 1表示在默认显著性水平5%下拒绝原假设。在这种情况下,均值的95%置信区间不包括假设的总体均值1.15美元。

您可能要更贴切一点调查价格的转变。功能ttest2测试如果两个独立的样本来自相等但未知的标准偏差,并且在同一平均正态分布,对抗的替代方案,该装置是不相等的。

并[h,SIG,CI] = ttest2(价格1,price2)
H = 1
SIG = 0.0083
ci =2×1-5.7845 - -0.9155

在默认的5%显著性水平上拒绝原假设,并且均值差的置信区间不包括假设值0。有缺口的箱形图是另一种形象化移位的方法。

箱线图(如价格,1)H = GCA;h.XTick = [1 2];h.XTickLabel = {“1月”“2”};xlabel('月') ylabel ('价格($ 0.01)'

图包含轴对象。轴对象包含类型的线14级的对象。

该图显示了样本在中位数周围的分布。计算每个方框中凹槽的高度,以便当它们的中值在默认显著性水平(5%)不同时,相邻方框具有不重叠的凹槽。计算是基于数据正态性的假设,但对其他分布的比较是相当可靠的。并排的图提供了一种视觉假设检验,比较的是中值而不是平均值。上面的图似乎几乎拒绝了等中位数的零假设。

非参数Wilcoxon秩和检验,通过函数来​​实现ranksum中,可以使用量化位数相等的测试。它测试,如果两个独立的样本来自相同连续(不一定正常)分布与中值相等,针对替代方案,它们不具有相等的位数。

[P,H] = ranksum(价格1,price2)
p = 0.0095
H =逻辑1

该检验拒绝在默认的5%显著性水平上的等中位数的零假设。

也可以看看

|||||

相关的话题