ecdf

经验累积分布函数

描述

[FX] = ECDF(ÿ返回经验累积分布函数(cdf),F,在点处取值X使用在载体中的数据ÿ

在生存和可靠度分析,此经验CDF被称为的Kaplan-Meier估计值。而数据可能对应于生存或失败倍。

[FX] = ECDF(ÿ名称,值返回经验函数值,F,在点处取值X,以及由一个或多个指定的附加选项名称,值对参数。

例如,您可以指定的函数来计算的类型或数据检查。

[FXFLO管理方] = ECDF(___也返回该评价函数值的95%的降低和上置信边界。您可以在前面的语法使用任意的输入参数。

ecdf计算使用的置信区间格林伍德的公式。它们不是同时存在的置信区间。

ECDF(___通过使用绘制函数评估的阶梯曲线图楼梯功能。指定“边界”,“上”包括图中的置信区间。

ECDF(斧头___指定的轴上的图形斧头而不是当前的坐标轴(gca)。

例子

全部收缩

计算累积分布函数(CDF)的模拟主机存活数据的Kaplan-Meier估计值。

生成从与参数3和1中的Weibull分布存活数据。

RNG('默认'%,持续重现failuretime =随机('WBL',3,1,15,1);

计算CDF生存数据的Kaplan-Meier估计。

(f (x) = ecdf (failuretime);(f (x)
ANS =16×20 0.0895 0.0667 0.0895 0.1333 0.1072 0.2000 0.1303 0.2667 0.1313 0.3333 0.2718 0.4000 0.2968 0.4667 0.6147 0.5333 0.6684 0.6000 1.3749⋮

画出估计CDF。

ecdf (failuretime)

计算和绘制模拟右截尾生存数据的危险函数。

从伯恩鲍姆 - 桑德斯分布产生故障时间。

RNG('默认'%用于重现failuretime =随机(“birnbaumsaunders”,0.3,1,100,1);

假定研究结束是在时间0.9,产生指示模拟故障次数是比0.9作为截尾数据较大的逻辑阵列,和存储在矢量此信息。

T = 0.9;经社=(failuretime> T);

绘制用于所述数据的经验风险函数。

ecdf (failuretime'功能'“累积风险”“截尾”岑,“边界”'上');

生成右截尾生存数据,并将经验累积分布函数(cdf)与已知的cdf进行比较。

从15个平均故障时间的指数分布产生故障时间。

RNG('默认'%用于重现Y = exprnd(15,75,1);

从平均故障时间为30的指数分布中生成退出时间。

d = exprnd(30,75,1);

生成观察到的故障时间。它们是生成的故障时间和退出时间的最小值。

t = min (y, d);

创建表示产生失效时间是比辍学倍大的逻辑阵列。对于这这是真实的数据审查。

审查= (y > d);

计算经验CDF和置信区间。

并[f,X,FLO,FUP] = ECDF(T,“截尾”,审查);

画出cdf和置信界限。

图()ECDF(T,“截尾”审查,“边界”'上');持有

叠加已知种群cdf的图。

xx = 0。1:马克斯(t);yy = 1-exp (- xx / 15);情节(xx, yy,“g -”“线宽”,2)轴线([0 50 0 1])图例('经验'“LCB”“联合”'人口'“位置”'东南')举行

生成生存数据并绘制具有99%置信范围的经验生存函数。

生成从与参数100和2中的Weibull分布寿命数据。

RNG('默认'%用于重现R = wblrnd(100、2100、1);

绘制具有99%置信界限的数据的幸存者函数。

ECDF(R,'功能''幸存者'“α”, 0.01,“边界”'上')举行

拟合威布尔幸存者函数。

x = 1:1:250;wblsurv = 1-cdf (“韦伯”中,x,100,2);图(X,wblsurv,“g -”“线宽”2)传说('经验'“LCB”“联合”'人口'“位置”'东北'

根据实际分布的幸存者功能是置信区间内。

输入参数

全部收缩

输入数据,指定为矢量。例如,在生存或可靠性分析,数据可能是为每个项目或个体的生存或失效时间。

ecdf忽略为NaNÿ。此外,任何为NaN在截尾矢量值(“截尾”)或频矢量(“频率”)原因ecdf忽略对应的值ÿ

数据类型:|

图形的柄ecdf阴谋,指定为把手。

举例来说,如果H是一个数字的句柄,然后ecdf可以画出如下图。

例:ecdf (h, x)

名称 - 值对参数

指定可选的用逗号分隔的对名称,值参数。的名字是参数的名称和价值为对应值。的名字必须出现引号内。您可以按照任何顺序指定多个名称和值对参数名1,值1,...,NameN,值N

例:“审查”,c,“功能”,“累积风险”、“阿尔法”,0.025,“边界”,“上”该指定ecdf返回累积风险函数和绘制了97.5%的置信区间,占向量所指定的截尾数据C

截尾数据,指定为逗号分隔的一对包括指示器“截尾”和相同尺寸的布尔阵列X。输入1的观察,并对审查和0对于那些完全观察观察。默认值是所有观测值都完全遵守。

ecdf忽略任何一个为NaN该截尾向量中的值。此外,任何为NaNÿ或者频率矢量(“频率”)原因ecdf忽略截尾向量中对应的值。

例:如果向量cdata存储审查数据信息,请输入“审查”,cdata

数据类型:合乎逻辑

观测的频率,指定为逗号分隔的一对组成的“频率”和包含非负整数的向量计数。这个向量和这个向量大小相同X。该Ĵ这个向量的第一个元素给出了Ĵ的第i个元素X被观测到。默认值是每一个元件的观察X

ecdf忽略任何一个为NaN这个频率向量的值。此外,任何为NaNÿ或审查向量(“截尾”)原因ecdf忽略频率向量中对应的值。

例:如果failurefreq输入是频率矢量吗'频率',failurefreq

数据类型:|

评估函数的置信区间的显著性水平,指定为由逗号分隔的对组成“α”和范围内的(0,1)之间的标量值。默认值是0.05,95%的信心。对于给定的值α,置信水平为100(1α)%。

例如,对于99%置信区间,您可以如下指定alpha值。

例:“阿尔法”,0.01

数据类型:|

功能该类型ecdf计算并返回,指定为逗号分隔的对,由'功能'与下列情况之一。

“提供” 违约。累积分布函数。
'幸存者' 存活函数。
“累积风险” 累积风险的功能。

例:“函数”、“累积风险的

用于包含边界的指示符,指定为逗号分隔的对,由“边界”与下列情况之一。

“关” 违约。指定省略界限。
'上' 指定要包括边界。

注意

这名值参数仅用于绘图。

例:“边界”,“上”

输出参数

全部收缩

函数值在评估点X,返回为列向量。

对数据向量中的观察点进行排序ÿ,返回为列向量。

ecdf排序ÿ,删除已排序中的重复值ÿ,并将结果保存到输出中X。输出X包括的最小值ÿ作为它的前两个值。这两个值对于绘制输出非常有用ecdf使用楼梯功能。

置信开往评估函数,返回的列向量。ecdf计算使用的置信区间格林伍德的公式。它们不是同时存在的置信区间。

置信上限开往评价函数,返回为列向量。ecdf计算使用的置信区间格林伍德的公式。它们不是同时存在的置信区间。

更多关于

全部收缩

格林伍德的公式

近似的Kaplan-Meier估计的方差。

方差估计由下式给出

V 小号 Ť = 小号 2 Ť Ť 一世 < Ť d 一世 [R 一世 [R 一世 d 一世

在哪里[R一世这个数字在时间上有危险吗Ť一世,d一世是在时间的故障数Ť一世

参考

[1]考克斯,D.R。,和D.奥克斯。生存数据分析。伦敦:查普曼和霍尔出版社,1984年。

[2] Lawless的,J. F.统计模型和寿命数据的方法。第二版,新泽西州霍博肯市:John Wiley和Sons公司,2003。

扩展功能

之前介绍过的R2006a