键糟

一个示例Kolmogorov-Smirnov测试

描述

例子

h=键糟(x返回对向量中的数据的零假设的测试决定x来自于标准正态分布,而不是来自于这种分布,使用一个示例Kolmogorov-Smirnov测试.结果h1如果检验在5%显著性水平上拒绝了原假设,或者0否则。

例子

h=键糟(x名称,值返回一个示例Kolmogorov-Smirnov测试的测试决定,其中包含由一个或多个名称-值对参数指定的附加选项。例如,您可以对标准正态以外的分布进行测试,更改显著性水平,或进行单边测试。

例子

hp) =键糟(___也返回p-价值p在假设测试中,使用来自先前语法的任何输入参数。

例子

hpksstat.简历) =键糟(___还返回测试统计的值ksstat.和近似的临界值简历测试。

例子

全部折叠

通过使用执行一个样本的Kolmogorov-Smirnov测试键糟.通过直观地比较经验累积分布函数(cdf)和标准正态cdf来确定测试决定。

加载考试数据集。创建包含第一列的考试成绩数据的向量。

负载考试test1 =成绩(:1);

测试NULL假设,即数据来自均值为75的正态分布,标准偏差为10.使用这些参数以中心和缩放数据向量的每个元素,因为键糟默认测试标准正常分布。

x =(test1-75)/ 10;h = kstest(x)
h =逻辑0

归还的价值h = 0表示键糟未能在默认的5%显著性水平上拒绝原假设。

绘制经验CDF和标准正常CDF进行视觉比较。

CDFPLOT(x)持有x_values = linspace(最小(x)最大(x));情节(x_values normcdf (x_values 0 1),的r -) 传奇(“经验提供”“标准正常运作”'地点''最好的事物'

图中显示了有中心和缩放的数据向量的经验cdf与标准正态分布的cdf之间的相似性。

加载示例数据。创建一个包含学生考试成绩数据第一列的向量。

负载考试;x =成绩(:1);

指定假设分布为两列矩阵。第1列包含数据向量x.列2包含对中的每个值求值的cdf值x对于一个假设的学生 t 分布在75的位置参数,尺度参数为10和一定程度的自由度。

test_cdf = [x,cdf(“tlocationscale”, 75岁的x 10,1)];

检验数据是否来自假设分布。

h = kstest(x,“提供”test_cdf)
h =逻辑1

归还的价值h = 1表示键糟拒绝默认5%的显着性水平下的空假设。

加载示例数据。创建一个包含学生考试成绩数据第一列的向量。

负载考试;x =成绩(:1);

创建一个概率分布对象来测试数据是否来自学生的 t 分布在75的位置参数,尺度参数为10和一定程度的自由度。

test_cdf = makedist(“tlocationscale”'亩', 75,“σ”10,'nu'1);

检验数据来自假设分布的零假设。

h = kstest(x,“提供”test_cdf)
h =逻辑1

归还的价值h = 1表示键糟拒绝默认5%的显着性水平下的空假设。

加载示例数据。创建包含学生考试成绩的第一列的向量。

负载考试;x =成绩(:1);

创建一个概率分布对象来测试数据是否来自学生的 t 分布在75的位置参数,尺度参数为10和一定程度的自由度。

test_cdf = makedist(“tlocationscale”'亩', 75,“σ”10,'nu'1);

在1%显著性水平下检验数据来自假设分布的零假设。

(h p) =键糟(x,“提供”test_cdf,'Α',0.01)
h =逻辑1
p = 0.0021

归还的价值h = 1表示键糟在1%显著性水平上拒绝零假设。

加载示例数据。创建一个包含股票返回数据矩阵第三列的向量。

负载储存者;X =股票(:,3);

对数据来自标准正态分布的原假设和数据的总体cdf大于标准正态cdf的备择假设进行检验。

[h p、k、c] =键糟(x,'尾巴'“大”
h =逻辑1
p = 5.0854e-05
k = 0.2197
C = 0.1207.

归还的价值h = 1表示键糟拒绝缺点的假设,有利于默认的5%意义水平的替代假设。

绘制经验CDF和标准正常CDF进行视觉比较。

[f, x_values] = ecdf (x);J =情节(x_values f);持有;K =情节(x_values normcdf (x_values),“r——”);集(J,'行宽'2);集(K,'行宽'2);传奇(K [J],“经验提供”“标准正常运作”'地点''se');

图中显示了数据向量的经验cdf之间的差异x和标准正态分布的CDF。

输入参数

全部折叠

示例数据,指定为向量。

数据类型:单身的|

名称-值对的观点

指定可选的逗号分隔的对名称,值参数。姓名参数名和价值是相应的价值。姓名必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“尾巴”,“大”,“阿尔法”,0.01使用替代假设的测试指定测试,其中绘制样本数据的群体的CDF大于假假设分布的CDF,在1%的意义水平下进行。

假设试验的意义水平,指定为逗号分隔对组成'Α'和范围(0,1)的标量值。

例子:'alpha',0.01

数据类型:单身的|

假设连续分布的CDF,指定逗号分隔对由“提供”或者是两列矩阵或者是连续的概率分布对象。当提供是一个矩阵,第1列包含一组可能的x值和第2列包含相应的假设累积分布函数值Gx)。计算最有效的是提供指定了这样的列1包含数据向量中的值x.如果有值x的第1栏中未找到提供键糟接近Gx)通过插值。所有价值x的第一列的最小值和最大值之间的间隔提供.默认情况下,键糟测试标准正态分布。

一个示例Kolmogorov-Smirnov测试仅对连续累积分配功能有效,并且需要提供是预先确定的。如果结果不准确的话提供是根据数据估计的。测试x在不指定分布参数的情况下,使用正态、对数正态、极值、威布尔或指数分布莉莉亚特代替。

数据类型:单身的|

要评估的替代假设的类型,指定为逗号分隔的对,由'尾巴'下面是其中之一。

'不等' 测试替代假设,即人口的CDFx不等于假设分布的CDF。
“大” 测试替代假设,即人口的CDFx被绘制大于假设分布的CDF。
'小' 测试替代假设,即人口的CDFx小于假设分布的CDF。

如果数据向量中的值x从假设分布,经验分布函数,趋于大于预期x趋向于较小,反之亦然。

例子:“尾巴”,“大”

输出参数

全部折叠

假设检验结果,作为逻辑值返回。

  • 如果h= 1,表示拒绝零假设Α显著性水平。

  • 如果h= 0,这表示在Α显著性水平。

p-测试的值,作为范围[0,1]内的标量值返回。p是观察到一个检验统计量与零假设下的观测值相同或更极端的概率。小的值p对无效假设的有效性产生了怀疑。

假设检验的检验统计量,返回为非负标量值。

临界值,作为非负标量值返回。

更多关于

全部折叠

一个示例Kolmogorov-Smirnov测试

单样本Kolmogorov-Smirnov检验是对原假设的非参数检验,即数据的总体cdf等于假设cdf。

“不平等”CDF函数的双面测试测试零假设,以反对数据的群体CDF的替代方案不等于假设的CDF。测试统计是从中计算的经验CDF之间的最大绝对差异x假设的cdf:

D 马克斯 x | F x - G x |

在哪里 F x 实证的CDF是和吗 G x 为假设分布的CDF。

“更大”cdf函数的单侧检验是针对数据的总体cdf大于假设cdf的备选方案来检验原假设。检验统计量是计算经验cdf的最大数量x超过假设的cdf:

D 马克斯 x F x - G x

“较小”CDF功能的片面测试测试零假设,反对数据的群体CDF的替代方案小于假设的CDF。测试统计是假设的CDF超过由此计算的经验CDF的最大数量x

D 马克斯 x G x - F x

键糟计算临界值简历使用近似公式或表中的插值。公式和表覆盖了范围0.01≤.α≤.0.2用于双面测试和0.005≤.α≤.0.1用于片面测试。简历返回的是如果α超出这个范围。

算法

键糟通过比较来决定拒绝零假设p-价值p在显著性水平下Α而不是通过比较测试统计数据ksstat.临界值简历.自简历是近似的,比较ksstat.简历偶尔会导致比比较的不同结论pΑ

参考文献

[1] Massey, F. J. < Kolmogorov-Smirnov拟合优度检验>美国统计协会杂志.1951年第46卷253期68-78页。

[2] Miller, L. H. <科尔莫戈罗夫统计百分比表>。美国统计协会杂志.第51卷,第273期,1956年,第111-121页。

马萨利亚,G.,曾伟,王杰。“评估柯尔莫哥洛夫的分布。”统计软件.2003年第8卷第18期

另请参阅

||

在R2006A之前介绍