主要内容

chi2gof

卡方拟合优度检验

描述

例子

H= chi2gof(X的)返回null假设的测试决定,即向量中的数据X来自正常分布,估计平均值和方差X,使用卡方拟合优度检验。另一种假设是,数据并非来自这样的分布。结果是H1如果检验在5%显著性水平上拒绝了原假设,并且0.除此以外。

例子

H= chi2gof(X名称,价值的)使用由一个或多个名称-值对参数指定的附加选项返回卡方拟合优度测试的测试决定。例如,您可以对非正态分布进行测试,或者更改测试的显著性级别。

例子

[HP.) = chi2gof (___的)还返回P.价值P.假设测试,使用来自前面语法的任何输入参数。

例子

[HP.统计数据) = chi2gof (___的)还返回结构统计数据,包含有关测试统计信息的信息。

例子

全部收缩

创建一个标准正态概率分布对象。生成数据向量X使用分布的随机数。

pd = makedist('普通的');rng.默认的;再现性的百分比x =随机(pd, 100, (1);

测试null假设,数据在X来自一个正态分布的总体。

h=chi2gof(x)
H = 0.

返回的价值H = 0.表明chi2gof不拒绝默认5%显著性水平的无效假设。

创建一个标准正态概率分布对象。生成数据向量X使用分布的随机数。

pd = makedist('普通的');rng.默认的;再现性的百分比x =随机(pd, 100, (1);

测试null假设,数据在X来自1%重要水平的正常分布的人口。

[h,p] = chi2gof(x,“α”,0.01)
H = 0.
P = 0.3775.

返回的价值H = 0.表明chi2gof在1%的重要性水平下不会拒绝零假设。

加载灯泡寿命样本数据。

加载灯泡

创建来自数据矩阵的第一列的向量,其中包含灯泡为单位的生命周期。

x =灯泡(:,1);

测试null假设,数据在X来自威布尔分布的人口。用Fitdist.创建概率分布对象一种B.根据数据估计的参数。

pd = fitdist (x,“威布尔”);h = chi2gof(x,“CDF”,PD)
H = 1

返回的价值H = 1表明chi2gof在默认的5%显著性水平上拒绝零假设。

创建六个编号为0到5的容器,用于数据池。

垃圾箱= 0:5;

创建包含每个垃圾箱的观察计数的矢量,并计算观察总数。

obsCounts = [6 16 10 12 4 2];n =总和(obsCounts);

将泊松概率分布对象拟合到数据,并计算每个箱子的预期计数。使用转置运算符.'转化垃圾箱妨碍从行向量到列向量。

pd = fitdist(垃圾箱',“泊松”“频率”,掩盖');Expcounts = n * pdf(pd,箱);

测试null假设,数据在妨碍来自于泊松分布,参数为lambdaHat

(h p st) = chi2gof(垃圾箱,“点击率数据”,垃圾箱,...“频率”,掩盖,...“预期”,expcounts,...'nparams',1)
H = 0.
p = 0.4654.
圣=结构与字段:CHI2STAT:2.5550 DF:3边缘:[-0.5000 0.5000 1.5000 2.5000 3.5000 5.5000:[6 16 10 12 6] E:[7.0429 13.8041 13.5280 8.8383 6.0284]

返回的价值H = 0.表明chi2gof不拒绝默认5%显著性水平的无效假设。向量E.包含无效假设下每个箱子的预期计数,以及O.包含每个容器的观察计数。

使用概率分布函数NORMCDF.作为卡方拟合优度检验中的函数句柄(chi2gof)。

测试null假设,样本数据在输入向量中X来自参数的正常分布μ.σ等于平均值(意思是)和标准差(性病)的样本数据。

rng(“默认”的)%为了再现性x = normrnd (5100 1);h = chi2gof(x,“cdf”, {@normcdf,意味着(x),性病(x)})
H = 0.

返回的结果H = 0.表明chi2gof不拒绝默认5%显著性水平的无效假设。

输入参数

全部收缩

假设检验的样本数据,指定为向量。

名称 - 值参数

指定可选的逗号分离对名称,价值论据。的名字是参数名称和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数名称1,值1,…,名称,值

例子:'NBins',8,'Alpha',0.01将数据分成8个箱子,在1%显著性水平下进行假设检验。

用于数据池的容器数量,指定为逗号分隔对组成'nbins'和积极的整数值。如果指定值NBins,请勿指定值点击率数据边缘

例子:'nbins',8

数据类型:|双重的

BIN中心,指定为逗号分隔对组成“点击率数据”和每个箱子的中心值向量。如果指定点击率数据,请勿指定值NBins边缘

例子:'Ctrs',[1 2 3 4 5]

数据类型:|双重的

Bin边缘,指定为逗号分隔的配对组成'边'每个垃圾箱的边缘值矢量。如果指定值边缘,请勿指定值NBins点击率数据

例子:'Edges',[-2.5 -1.5 -0.5 0.5 1.5 2.5]

数据类型:|双重的

假设分布的cdf,指定为逗号分隔对,由“CDF”概率分布对象、函数句柄或单元格数组。

  • 如果CDF.是一个概率分布对象,自由度说明您是否使用Fitdist.或使用makedist

  • 如果CDF.是一个函数句柄,分布函数必须X作为它唯一的论点。

  • 如果CDF.是一个单元阵列,第一元素必须是函数句柄,并且剩余元素必须是每个单元格的参数值。该功能必须采取X作为其第一个参数,以及数组中的其他参数作为稍后的参数。

如果指定值CDF.,请勿指定值预期

例子:“CDF”,pd_对象

数据类型:|双重的

每个垃圾箱的预期计数,指定为逗号分隔的对“预期”和一个非负值的向量。如果预期取决于估计的参数,使用NParams确保chi2gof正确计算自由度。如果指定值预期,请勿指定值CDF.

例子:“预期的”[19.1446 18.3789 12.3224 8.2432 4.1378]

数据类型:|双重的

用于描述空分布的估计参数的数量,指定为逗号分隔的配对'nparams'和积极的整数值。该值根据用于计算CDF或预期计数的估计参数的数量来调整测试的自由度。

的默认值NParams取决于指定空分布的方式:

  • 如果您指定CDF.作为概率分布对象,NParams等于用于创建对象的估计参数的数量。

  • 如果您指定CDF.作为函数名或句柄,默认值为NParams0.

  • 如果您指定CDF.作为单元阵列,默认值NParams是数组中的参数数。

  • 如果您指定预期的默认值NParams0.

例子:“NParams”,1

数据类型:|双重的

每个箱的最小预期计数,指定为逗号分隔对,由'Emin'和一个非负整数值。如果任一尾部最末端的料仓的预期值小于艾敏,它与邻近的垃圾箱组合,直到每个极端箱中的计数至少为5.如果任何内部箱都有少于5,则chi2gof显示警告,但不会组合内部垃圾箱。在这种情况下,您应该使用更少的垃圾箱,或提供箱中心或边缘,以增加所有垃圾箱中的预期计数。指定艾敏作为0.防止垃圾箱的组合。

例子:'Emin',0

数据类型:|双重的

数据值的频率,指定为由逗号分隔的对组成“频率”和一个非负整数值的向量,其长度与该向量相同X

例子:“频率”[20 16 13 10 8]

数据类型:|双重的

假设检验的显著性水平,指定为逗号分隔对组成“α”和范围(0,1)中的标量值。

例子:“阿尔法”,0.01

数据类型:|双重的

输出参数

全部收缩

假设测试结果,返回10.

  • 如果H= 1,这表明拒绝零假设阿尔法意义水平。

  • 如果H= 0.,这表明未能拒绝零假设阿尔法意义水平。

P.-测试的值,作为范围[0,1]内的标量值返回。P.是观察测试统计学的概率,如零假设下观察到的值。小值P.对零假设的有效性倾诉。

测试统计数据,作为包含以下内容的结构返回:

  • Chi2stat.—测试统计值。

  • DF.-测试的自由度。

  • 边缘-池后的bin边向量。

  • O.-向量观察计数为每个箱子。

  • E.-每个箱子的预期计数向量。

更多关于

全部收缩

卡方拟合优度检验

卡方拟合优度检验确定数据样本是否来自特定的概率分布,参数由数据估计。

测试将数据分组到bins,计算这些bins的观察计数和预期计数,并计算卡方检验统计量

χ 2 = 一世 = 1 N. O. 一世 E. 一世 的) 2 / E. 一世

在哪里O.一世观察到的数目和E.一世是基于假设分布的期望计数。当计数足够大时,检验统计量具有近似卡方分布。

算法

chi2gof将检验统计量的值与自由度为的卡方分布进行比较梯度方向数- 1 -nparams.哪里梯度方向数是用于数据池的箱数和nparams.是用于确定预期计数的估计参数数。如果没有足够的自由度进行测试,chi2gof返回P.-价值为

扩展功能

也可以看看

|

话题

之前介绍过的R2006a