主要内容

假设检验

假设检验是基于样本的统计证据对总体进行推断的常用方法。

作为一个例子,假设有人说,马萨诸塞州的某个时候,一加仑常规无铅天然气的平均价格为1.15美元。你怎么能决定声明的真相?您可以尝试在当时在州的每个加油站的价格找到价格。这种方法将是明确的,但它可能是耗时的,昂贵的,甚至不可能的。

一种更简单的方法是在州内随机选择一小部分加油站的价格,然后计算样本平均值。

由于选择过程中的机会可变性,样本平均值彼此不同。假设您的样本平均值为1.18美元。$ 0.03差异是随机抽样的文物或大量证据表明一加仑天然气的平均价格实际上大于1.15美元吗?假设检测是制定此类决策的统计方法。

此示例显示如何使用假设检验在两个单独的几个月内分析在马萨诸塞州的状态下测量的天然气价格。

此示例使用文件中的天然气价格数据gas.mat.该文件包含了两份1993年马萨诸塞州附近每加仑汽油价格的随机样本。第一个样本,price1,在1月份的一天内包含20个国家随机观察。第二个样本,price2,包含了一个月后在该州周围的20个随机观察结果。

加载气体price = [price1 price2];

作为第一步,您可能希望测试样本来自正常分布的假设。一个正常的概率图给出了一个快速的想法。

normplot(价格)

图中包含一个坐标轴。标题为正态概率图的坐标轴包含6个类型为line的对象。

两个散点通过样本的第一和第三个四分位数近似地沿直线分布,表明近似正态分布。2月份的样本(右边那条线)显示了下尾与正常水平的轻微偏离。从1月到2月,平均值的变化是明显的。一个假设检验被用来量化正态检验。由于每个样本相对较小,建议进行Lilliefors测试。

莉莉亚特(Price1)
ans = 0.
莉莉斯特(Price2)
ans = 0.

默认意义水平lillietest是5%。每个测试返回的逻辑0表示拒绝样本是正态分布的零假设的失败。这种失败可能反映了总体的正态性,也可能反映了由于样本量小,对零假设缺乏强有力的证据。

现在计算样本均值。

sample_means =意味着(价格)
sample_means =1×2115.1500 - 118.5000

您可能希望测试Null假设,即1月样本当天对整个国家的平均价格为1.15美元。如果您知道历史上,历史上的价格标准偏差,并且一直持续,则为0.04美元,那么Z.- 最恰当。

[H,Pvalue,CI] = ZTEST(Price1 / 100,1.15,0.04)
H = 0.
pvalue = 0.8668
ci =2×11.1340 - 1.1690

逻辑输出H= 0表示在默认显着性级别为5%的情况下拒绝禁止NULL假设。这是NULL假设下的高概率的结果,由此表示P.值,观察一个值作为极端或更极端的Z.- 从样本计算的艺术性。平均值的95%置信区间[1.1340 1.1690]包括1.15美元的假设人口平均值。

之后的样本是否提供了更有力的证据,来拒绝2月份全州平均价格为1.15美元的无效假设?概率图中显示的移位和计算样本均值的差异表明了这一点。这一变化可能表明市场出现了重大波动,从而引发了对使用历史标准偏差的有效性的质疑。如果不能假设一个已知的标准差,则aT.-test更合适。

(h, pvalue, ci) = tt (price2/100, 1.15)
H = 1
pvalue = 4.9517e-04
ci =2×11.1675 1.2025

逻辑输出H= 1表示在默认显著性水平5%下拒绝原假设。在这种情况下,均值的95%置信区间不包括假设的总体均值1.15美元。

您可能希望更密切地调查价格的转变。功能ttest2测试如果两个独立的样本来自具有相同但未知的标准偏差的正常分布,而且相同的平均值,则违背手段不等的替代方案。

[H,SIG,CI] = TTEST2(Price1,Price2)
H = 1
sig = 0.0083.
ci =2×1-5.7845 - -0.9155

在默认的5%显著性水平上拒绝原假设,并且均值差的置信区间不包括假设值0。有缺口的箱形图是另一种形象化移位的方法。

Boxplot(价格,1)H = GCA;h.xtick = [1 2];h.xticklabel = {“1月”“2”};Xlabel('月') ylabel ('价格(0.01美元)'

图中包含一个坐标轴。轴包含14个类型的类型。

该图显示了样本在中位数周围的分布。计算每个方框中凹槽的高度,以便当它们的中值在默认显著性水平(5%)不同时,相邻方框具有不重叠的凹槽。计算是基于数据正态性的假设,但对其他分布的比较是相当可靠的。并排的图提供了一种视觉假设检验,比较的是中值而不是平均值。上面的图似乎几乎拒绝了等中位数的零假设。

非参数Wilcoxon等级和由函数实现的Ranksum.,可用于量化相等中位数的测试。它测试了两个独立的样本是否来自与平等中位数相同的连续(不一定正常)分布,反对它们没有等于中位数的替代方案。

[p,h] = Ranksum(Price1,Price2)
p = 0.0095
h =逻辑1

该检验拒绝在默认的5%显著性水平上的等中位数的零假设。

也可以看看

|||||

相关的话题