主要内容

假设检验的术语

所有假设检验都有相同的基本术语和结构。

  • 一个零假设是一个关于要测试的总体的断言。它是“无效的”,因为它经常代表一种现状信念,例如缺乏一个特征或缺乏一个效果。它可以通过断言一个总体参数或多个总体参数的组合具有一定的值来形式化。的例子中假设检验,零假设是,整个州的天然气平均价格是1.15美元。这是写H0µ= 1.15。

  • 一个备择假设是一个可以用零假设来检验的关于总体的对比断言。的例子中假设检验,可能的替代假设有:

    H1µ≠1.15 -州平均与$1.15不同(双尾检验)

    H1µ> 1.15 -州平均值大于$1.15(右尾检验)

    H1µ< 1.15 -州平均低于$1.15(左尾检验)

  • 为了进行假设检验,从总体中随机收集一个样本,并进行相关的检验统计量的计算来总结样本。这个统计量随检验的类型而变化,但它在零假设下的分布必须是已知的(或假设的)。

  • p值检验的概率是在原假设下,得到检验统计量的一个值比从样本中计算的值更极端的概率。

  • 显著性水平测试的概率是一个阈值α在测试进行前,同意。的典型值α是0.05。如果p值小于α,检验拒绝无效假设。如果p值大于α,没有足够的证据拒绝零假设。请注意,缺乏拒绝零假设的证据并不等于接受零假设的证据。还要注意,替代方案的实质性“显著性”不能从检验的统计显著性中推断出来。

  • 的显著性水平α可以解释为拒绝零假设的概率,当零假设是真的,a第一类误差.检验统计量在原假设下的分布决定了概率α类型I错误。即使零假设没有被拒绝,它仍然可能是false-aII型错误.在备择假设下检验统计量的分布决定了概率βII型错误。第二类错误通常是由于样本量小。的权力对于一个测试,1 -β,是正确拒绝错误零假设的概率。

  • 假设检验的结果通常与一个置信区间.置信区间是参数的真实总体值在特定概率下的估计范围。置信区间的上界和下界由参数的样本估计和已知(或假设)的估计量的抽样分布来计算。一个典型的假设是,在重复抽样的情况下,估计值将是正态分布的(根据中心极限定理)。更宽的置信区间对应较差的估计(更小的样本);较窄的间隔对应较好的估计(较大的样本)。如果null假设断言总体参数的值,当假设值位于该参数的计算置信区间之外时,检验将拒绝null假设。

相关的话题