主要内容

chi2gof

卡方拟合优度检验

描述

例子

h= chi2gof (x返回零假设的测试决定,即数据在向量中x来自一个正态分布,其均值和方差估计来自x,使用卡方拟合优度检验.另一种假设是,数据并非来自这样的分布。结果h1如果检验在5%显著性水平上拒绝原假设,并且0否则。

例子

h= chi2gof (x名称,值返回卡方拟合优度测试的测试决策,其中包含由一个或多个名称-值对参数指定的附加选项。例如,您可以测试非正态分布,或者更改测试的显著性水平。

例子

hp] = chi2gof(___还返回p价值p的假设检验,使用来自前面语法的任何输入参数。

例子

hp统计数据] = chi2gof(___也返回结构统计数据,包含关于测试统计量的信息。

例子

全部折叠

创建标准的正态概率分布对象。生成数据向量x使用分布中的随机数。

Pd = makedist(“正常”);rng默认的再现率%X = random(pd,100,1);

检验数据中的零假设x来自于正态分布的总体。

H = chi2gof(x)
H = 0

返回值H = 0表明chi2gof在默认的5%显著性水平上不拒绝零假设。

创建标准的正态概率分布对象。生成数据向量x使用分布中的随机数。

Pd = makedist(“正常”);rng默认的再现率%X = random(pd,100,1);

检验数据中的零假设x来自于1%显著性水平正态分布的总体。

[h,p] = chi2gof(x,“α”, 0.01)
H = 0
P = 0.3775

返回值H = 0表明chi2gof在1%的显著性水平上不拒绝原假设。

加载灯泡寿命样本数据。

负载灯泡

从数据矩阵的第一列创建一个向量,其中包含灯泡的寿命(以小时为单位)。

X =灯泡(:,1);

检验数据中的零假设x来自具有威布尔分布的总体。使用fitdist创建一个概率分布对象一个而且B由数据估计的参数。

Pd = fitdist(x,“威布尔”);H = chi2gof(x,“提供”, pd)
H = 1

返回值H = 1表明chi2gof在默认的5%显著性水平上拒绝零假设。

创建6个容器,编号从0到5,用于数据池。

Bins = 0:5;

为每个箱子创建一个包含观察到的计数的向量,并计算观察到的总数。

obsCounts = [6 16 10 12 4 2];n = sum(obsCounts);

为数据拟合泊松概率分布对象,并计算每个箱子的期望计数。使用转置算子”。转换垃圾箱而且obsCounts从行向量到列向量。

Pd = fitdist(bin ',“泊松”“频率”obsCounts ');expCounts = n * pdf(pd,bins);

检验数据中的零假设obsCounts来自一个泊松分布,参数等于lambdaHat

[h,p,st] = chi2gof(箱子,“点击率数据”垃圾箱,...“频率”obsCounts,...“预期”expCounts,...“NParams”,1)
H = 0
P = 0.4654
圣=带字段的结构:chi2stat: 2.5550 df: 3 edges: [-0.5000 0.5000 1.5000 2.5000 3.5000 5.5000] O: [6 16 10 12 6] E: [7.0429 13.8041 13.5280 8.8383 6.0284]

返回值H = 0表明chi2gof在默认的5%显著性水平上不拒绝零假设。向量E包含零假设下每个箱子的预期计数,和O包含每个bin的观察计数。

使用概率分布函数normcdf作为卡方拟合优度检验中的函数句柄(chi2gof).

检验原假设,即样本数据在输入向量中x来自一个带参数的正态分布µ而且σ等于均值(的意思是)和标准差(性病)的样本数据。

rng (“默认”%用于再现性X = normrnd(50,5100,1);H = chi2gof(x,“提供”, {@normcdf,意味着(x),性病(x)})
H = 0

返回的结果H = 0表明chi2gof在默认的5%显著性水平上不拒绝零假设。

输入参数

全部折叠

假设检验的样本数据,指定为向量。

名称-值参数

指定可选参数对为Name1 = Value1,…,以=家,在那里的名字参数名称和价值对应的值。名称-值参数必须出现在其他参数之后,但对的顺序无关紧要。

在R2021a之前,使用逗号分隔每个名称和值,并将其括起来的名字在报价。

例子:“α”NBins, 8日,0.01将数据集中到8个箱子中,在1%显著性水平下进行假设检验。

用于数据池的容器数,指定为逗号分隔的对,由“NBins”一个正整数值。的值NBins,不指定值点击率数据边缘

例子:“NBins”,8

数据类型:|

Bin中心,指定为逗号分隔的对,由“点击率数据”以及每个箱子的中心值向量。的值点击率数据,不指定值NBins边缘

例子:'Ctrs',[1 2 3 4 5]

数据类型:|

Bin边,指定为逗号分隔的对,由“边缘”以及每个箱子的边值向量。的值边缘,不指定值NBins点击率数据

例子:'Edges',[-2.5 -1.5 -0.5 0.5 1.5 2.5]

数据类型:|

假设分布的cdf,指定为逗号分隔的对,由“提供”和概率分布对象,函数句柄或单元格数组。

  • 如果提供是一个概率分布对象,自由度是否占你估计的参数使用fitdist或者使用makedist

  • 如果提供一个函数是句柄,分配函数必须带吗x作为它唯一的论证。

  • 如果提供是单元格数组,第一个元素必须是函数句柄,其余元素必须是参数值,每个单元格一个。函数必须取x作为它的第一个参数,数组中的其他参数作为后面的参数。

的值提供,不指定值预期

例子:“提供”,pd_object

数据类型:|

的逗号分隔对指定的每个bin的预期计数“预期”和一个非负值的向量。如果预期取决于估计的参数,使用NParams为了确保chi2gof正确计算自由度。的值预期,不指定值提供

例子:'Expected',[19.1446 18.3789 12.3224 8.2432 4.1378]

数据类型:|

用于描述空分布的估计参数数,指定为由逗号分隔的对组成“NParams”一个正整数值。该值根据用于计算cdf或预期计数的估计参数的数量调整测试的自由度。

的默认值NParams取决于你如何指定空分布:

  • 如果你指定提供作为概率分布对象,NParams等于用于创建对象的估计参数的数目。

  • 如果你指定提供的默认值作为函数名或句柄NParams0

  • 如果你指定提供作为单元格数组,的默认值NParams数组中参数的个数。

  • 如果你指定预期的默认值NParams0

例子:“NParams”,1

数据类型:|

每个bin的最小期望计数,指定为逗号分隔的对,由“EMin”和一个非负整数值。如果任一尾部末端的箱子的期望值小于艾敏,它与相邻的bin组合,直到每个极端bin中的计数至少为5。如果任何内部容器的计数小于5,chi2gof显示警告,但不合并内部箱。在这种情况下,您应该使用更少的容器,或提供容器中心或边,以增加所有容器中的预期计数。指定艾敏作为0防止箱子合并。

例子:艾敏,0

数据类型:|

数据值的频率,指定为由逗号分隔的对组成“频率”一个非负整数值的向量它的长度和这个向量相同x

例子:“频率”,[20 16 13 10 8]

数据类型:|

假设检验的显著性水平,由逗号分隔的对组成“α”和范围(0,1)中的标量值。

例子:“阿尔法”,0.01

数据类型:|

输出参数

全部折叠

假设检验结果,返回为10

  • 如果h= 1,这表明在α显著性水平。

  • 如果h= 0,这表明拒绝零假设的失败α显著性水平。

p-value测试的值,作为范围[0,1]的标量值返回。p是在原假设下观察到的检验统计量与观察值一样极端或更极端的概率。的小值p对原假设的有效性提出质疑。

测试统计数据,作为包含以下内容的结构返回:

  • chi2stat-测试统计量的值。

  • df-测试的自由度。

  • 边缘-池化后的bin边向量。

  • O-每个bin的观察计数向量。

  • E-每个bin的期望计数向量。

更多关于

全部折叠

卡方拟合优度检验

卡方拟合优度检验确定数据样本是否来自指定的概率分布,参数由数据估计。

测试将数据分组到箱子中,计算这些箱子的观察到的和预期的计数,并计算卡方检验统计量

χ 2 1 N O E 2 / E

在哪里O观察到的计数和E是基于假设分布的预期计数。当计数足够大时,检验统计量具有近似卡方分布。

算法

chi2gof将检验统计量的值与自由度等于的卡方分布进行比较nbins- 1 -nparams,在那里nbins用于数据池和的容器数量是多少nparams用于确定预期计数的估计参数的数目。如果没有足够的自由度来进行测试,chi2gof返回p值为

扩展功能

版本历史

R2006a之前介绍

另请参阅

|

主题