主要内容

chi2gof

卡方拟合优度检验

描述

例子

h= chi2gof (x返回null假设的测试决定,即向量中的数据x来自于一个正态分布,其平均值和方差由x,使用卡方拟合优度检验.另一种假设是,数据不是来自这样的分布。结果h1如果检验在5%显著性水平上拒绝了原假设,并且0否则。

例子

h= chi2gof (x名称,值使用由一个或多个名称-值对参数指定的附加选项返回卡方拟合优度测试的测试决定。例如,您可以对非正态分布进行测试,或者更改测试的显著性级别。

例子

hp) = chi2gof (___还返回p价值p假设测试,使用来自前面语法的任何输入参数。

例子

hp统计数据) = chi2gof (___也返回结构统计数据,包含测试统计信息。

例子

全部折叠

创建一个标准正态概率分布对象。生成数据向量x使用分布中的随机数。

pd = makedist (“正常”);rng默认的%的再现性x =随机(pd, 100, (1);

测试null假设,数据在x来自一个正态分布的总体。

h = chi2gof (x)
h = 0

返回值h = 0表明chi2gof在默认的5%显著性水平上不拒绝零假设。

创建一个标准正态概率分布对象。生成数据向量x使用分布中的随机数。

pd = makedist (“正常”);rng默认的%的再现性x =随机(pd, 100, (1);

测试null假设,数据在x来自于1%显著性水平的正态分布的总体。

(h p) = chi2gof (x,“α”, 0.01)
h = 0
p = 0.3775

返回值h = 0表明chi2gof在1%显著性水平上不拒绝零假设。

加载灯泡寿命样本数据。

负载灯泡

从数据矩阵的第一列创建一个向量,其中包含灯泡的生命周期(以小时为单位)。

x =灯泡(:1);

测试null假设,数据在x来自一个威布尔分布的种群。使用fitdist来创建一个概率分布对象一个B根据数据估计的参数。

pd = fitdist (x,“威布尔”);h = chi2gof (x),“提供”, pd)
h = 1

返回值h = 1表明chi2gof在默认的5%显著性水平上拒绝零假设。

创建6个容器,编号为0到5,用于数据池。

垃圾箱= 0:5;

创建一个包含每个箱子的观察计数的向量,并计算观察总数。

obsCounts = [6 16 10 12 4 2];n =总和(obsCounts);

对数据拟合一个泊松概率分布对象,并计算每个容器的期望计数。使用转置算子”。转换垃圾箱obsCounts从行向量到列向量。

pd = fitdist(垃圾箱',“泊松”“频率”obsCounts ');expcount = n * pdf(pd,bins);

测试null假设,数据在obsCounts来自于泊松分布,参数为lambdaHat

(h p st) = chi2gof(垃圾箱,“点击率数据”垃圾箱,...“频率”obsCounts,...“预期”expCounts,...“NParams”,1)
h = 0
p = 0.4654
圣=结构体字段:chi2stat: 2.5550 df: 3 edges: [-0.5000 0.5000 1.5000 2.5000 3.5000 5.5000] O: [6 16 10 12 6] E: [7.0429 13.8041 13.5280 8.8383 6.0284]

返回值h = 0表明chi2gof在默认的5%显著性水平上不拒绝零假设。向量E包含null假设下每个容器的预期计数O包含每个容器的观察计数。

使用概率分布函数normcdf作为卡方拟合优度检验中的函数句柄(chi2gof).

测试null假设,样本数据在输入向量中x来自一个带参数的正态分布µσ等于平均值(的意思是)及标准偏差(性病)的样本数据。

rng (“默认”%的再现性x = normrnd (5100 1);h = chi2gof (x),“提供”, {@normcdf,意味着(x),性病(x)})
h = 0

返回的结果h = 0表明chi2gof在默认的5%显著性水平上不拒绝零假设。

输入参数

全部折叠

假设检验的样本数据,指定为向量。

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“α”NBins, 8日,0.01将数据分成8个箱子,在1%显著性水平下进行假设检验。

用于数据池的容器数量,指定为逗号分隔对组成“NBins”和一个正整数。如果指定的值NBins,则不指定值点击率数据边缘

例子:“NBins”,8

数据类型:|

Bin中心,指定为逗号分隔的对,由“点击率数据”以及每个箱子的中心值的向量。如果指定的值点击率数据,则不指定值NBins边缘

例子:'Ctrs',[1 2 3 4 5]

数据类型:|

Bin边,指定为逗号分隔对,由“边缘”以及每个箱子的边值向量。如果指定的值边缘,则不指定值NBins点击率数据

例子:'Edges',[-2.5 -1.5 -0.5 0.5 1.5 2.5]

数据类型:|

假设分布的cdf,指定为逗号分隔对,由“提供”概率分布对象、函数句柄或单元格数组。

  • 如果提供是一个概率分布对象,自由度说明你是否使用估计参数fitdist或者使用makedist

  • 如果提供一个函数的句柄,是分布函数必须取的吗x作为它唯一的论点。

  • 如果提供是单元格数组,第一个元素必须是函数句柄,其余元素必须是参数值,每个单元格一个。函数必须x作为它的第一个参数,数组中的其他参数作为后面的参数。

如果指定的值提供,则不指定值预期

例子:“提供”,pd_object

数据类型:|

指定为逗号分隔的对的每个容器的预期计数“预期”和一个非负值的向量。如果预期取决于估计的参数,使用NParams以确保chi2gof正确计算自由度。如果指定的值预期,则不指定值提供

例子:'Expected',[19.1446 18.3789 12.3224 8.2432 4.1378]

数据类型:|

用于描述空分布的估计参数的数量,指定为逗号分隔对组成“NParams”和一个正整数。这个值根据用于计算cdf或预期计数的估计参数的数量来调整测试的自由度。

的默认值NParams这取决于你如何指定空分布:

  • 如果您指定提供作为一个概率分布对象,NParams等于用于创建对象的估计参数的数量。

  • 如果您指定提供作为函数名或句柄,默认值为NParams0

  • 如果您指定提供作为单元格数组,默认值为NParams是数组中的参数个数。

  • 如果您指定预期的默认值NParams0

例子:“NParams”,1

数据类型:|

每个容器的最小期望计数,指定为逗号分隔的对,由“EMin”和一个非负整数值。如果任意尾部的垃圾桶的期望值小于艾敏,将其与相邻的容器合并,直到每个极端容器的计数至少为5。如果任何内部垃圾箱的计数小于5,chi2gof显示警告,但不合并内部的垃圾箱。在这种情况下,您应该使用更少的容器,或提供容器中心或边缘,以增加所有容器中的预期计数。指定艾敏作为0以防止组合容器。

例子:艾敏,0

数据类型:|

数据值的频率,指定为由逗号分隔的对组成“频率”一个非负整数值的向量和这个向量的长度相同x

例子:'Frequency',[20 16 13 10 8]

数据类型:|

假设检验的显著性水平,指定为逗号分隔对组成“α”和范围(0,1)的标量值。

例子:“阿尔法”,0.01

数据类型:|

输出参数

全部折叠

假设检验结果,返回为10

  • 如果h= 1,表示拒绝零假设α显著性水平。

  • 如果h= 0,这表示在α显著性水平。

p-测试的值,作为范围[0,1]内的标量值返回。p是观察到一个检验统计量与零假设下的观测值相同或更极端的概率。小的值p对无效假设的有效性产生了怀疑。

测试统计数据,作为包含以下内容的结构返回:

  • chi2stat—测试统计值。

  • df-测试的自由度。

  • 边缘-池后的bin边向量。

  • O-向量观察计数为每个箱子。

  • E-每个箱子的预期计数向量。

更多关于

全部折叠

卡方拟合优度检验

卡方拟合优度检验确定数据样本是否来自特定的概率分布,参数由数据估计。

测试将数据分组到bins,计算这些bins的观察计数和预期计数,并计算卡方检验统计量

χ 2 1 N O E 2 / E

在哪里O观察到的计数和E是基于假设分布的期望计数。当计数足够大时,检验统计量具有近似卡方分布。

算法

chi2gof将检验统计量的值与自由度为的卡方分布进行比较nbins- 1 -nparams,在那里nbins用于数据池和的容器的数量nparams用于确定预期计数的估计参数的数量。如果没有足够的自由度来进行测试,chi2gof返回p值为

扩展功能

另请参阅

|

主题

之前介绍过的R2006a