主要内容

假设检验

假设检验是一种常见的方法,绘制基于统计证据推断人口从一个样本。

作为一个例子,假如有人说,在一个特定的时间在马萨诸塞州一加仑普通无铅汽油的平均价格是1.15美元。你怎么能确定语句的真理?你可以试着发现价格在每一个加油站的状态。方法是确定的,但它可能是费时,昂贵的,甚至是不可能的。

一个更简单的方法是发现价格在少量的随机选择加油站的状态,然后计算出样本的平均水平。

样本平均数不同于另一个由于机会选择过程的变化。假设你的样本平均是1.18美元。是随机抽样的0.03美元差异工件或重要证据表明一加仑汽油的平均价格实际上是大于1.15美元?假设检验是统计方法等做出决策。

这个例子展示了如何使用假设检验来分析天然气价格衡量两个月期间在马萨诸塞州。

下面的例子使用了天然气价格数据文件gas.mat。该文件包含两个随机的样本一加仑汽油的价格在1993年在马萨诸塞州。第一个样本,price1,包含20个随机观察周围国家在1月份的一天。第二个样本,price2,包含20个随机观察周围的国家一个月后。

负载气体价格= [price1 price2];

作为第一步,您可能希望测试样本来自正态分布的假设。正态概率图给出了一个快速的想法。

normplot(价格)

图包含一个坐标轴对象。标题为正态概率图的坐标轴对象包含6行类型的对象。

两个散射近似遵循直线通过第一和第三个四分位数的样本,表明近似正态分布。2月样本(右边线)显示了轻微偏离常态下尾巴。转变意味着从1月到2月是显而易见的。假设检验是用来量化测试正常。因为每个样本相对较少,建议Lilliefors测试。

lillietest (price1)
ans = 0
lillietest (price2)
ans = 0

默认的显著性水平lillietest是5%。逻辑0返回的每个测试显示失败拒绝零假设,样本正态分布。这种失败可能反映了正常人群中也可能反映了缺乏强有力的证据对零假设由于小样本大小。

现在计算样本均值。

sample_means =意味着(价格)
sample_means =1×2115.1500 - 118.5000

您可能希望测试零假设在全州平均价格当天样本1月1.15美元。如果你知道价格的标准偏差在国家历史上,始终,是0.04美元,然后z以及是适当的。

[h, pvalue, ci] =中兴通讯(price1/100, 1.15, 0.04)
h = 0
pvalue = 0.8668
ci =2×11.1340 - 1.1690

逻辑输出h= 0表示失败拒绝零假设的默认显著性水平为5%。这是一个高概率的结果在零假设下,显示的p值,观察值的极端或更极端z从样本统计量计算。95%置信区间的意思是[1.1340 - 1.1690]包括假设总体均值为1.15美元。

后的样品提供有力的证据拒绝零假设的全国性的2月平均价格1.15美元吗?概率图中所示的转变和计算出的样本均值的差异表明这一点。这种转变可能表示市场大幅波动,质疑的有效性使用历史标准偏差。如果一个已知的标准偏差不能假定,一个t以及更合适。

(h, pvalue, ci) = tt (price2/100, 1.15)
h = 1
pvalue = 4.9517 e-04
ci =2×11.1675 - 1.2025

逻辑输出h= 1表示拒绝零假设的默认显著性水平为5%。在这种情况下,95%置信区间的意思是不包括假设总体均值为1.15美元。

您可能想要调查价格更密切的转变。这个函数ttest2测试如果两个独立样本来自正态分布与平等但未知标准差和同样的意思是,反对另一种手段是不平等的。

(h,团体,ci) = ttest2 (price1 price2)
h = 1
sig = 0.0083
ci =2×1-5.7845 - -0.9155

零假设被拒绝在默认5%的显著性水平,和置信区间的差异意味着不包括假设值0。切口箱线图是另一种可视化的转变。

箱线图(价格,1)h = gca;h。XTick = (1 - 2);h。XTickLabel = {“1月”,“2”};包含(“月”)ylabel (的价格($ 0.01))

图包含一个坐标轴对象。坐标轴对象包含14线类型的对象。

图显示分布的样本中位数周围。级的高度,计算在每一箱的箱子中位数时不重叠的等级是不同的在一个默认的5%显著性水平。计算是基于一个假设的正常数据,但其他发行版的比较是相当强大的。并排阴谋提供一种视觉假设检验,比较中位数,而不是手段。上面的情节似乎几乎不拒绝零假设的中位数相等。

非参数Wilcoxon等级和测试,实现的功能ranksum,可以用来量化的考验中位数相等。它测试如果两个独立样本来自相同的连续的(不一定是正常的)分布与平等的中位数,对他们没有平等的中位数的替代。

[p, h] = ranksum (price1 price2)
p = 0.0095
h =逻辑1

测试拒绝零假设的中位数在默认5%显著性水平。

另请参阅

|||||

相关的话题