统计和机器学习工具箱™功能ECDF
通过使用卡普兰 - 迈耶非参数方法产生经验累积危险,幸存者,和累积分布函数。卡普兰 - 迈耶估计遗功能也被称为乘积限估计。
在Kaplan-Meier法在使用生命表汇总存活数据。生命表按升序故障时间的顺序数据,但你不必在一个有序的方式来使用进入故障/存活时间ECDF
。
一个生命表通常包括:
故障时间
项目数未能在时间/时间段
审查在时间/时间段的项目数
有风险的项目在时间/时间段的起始编号
在风险的人口数量是幸存者在每个周期开始时的总数。在在第一期开始风险的数量是在终身学习的所有个人。在其余每个周期的开始,在风险的数量由在上一个周期结束审查的失败加上个人的数量减少。
该生命表显示虚构的生存数据。在第一次失败开始的时候,有七个项目的风险。在时间4,三会失败。因此,在时间7月初,有四个项目的风险。只有一个失败,在时间7,所以在时间11开始处于危险的数量是三个。两个失败的时候11,所以在时间12开始,在风险的数量是一个。其余项目未能在时间12。
故障时间(T) | 多次失败 | 在风险值 |
---|---|---|
4 | 3 | 7 |
7 | 1 | 4 |
11 | 2 | 3 |
12 | 1 | 1 |
可以估算出危险,累积风险,生存,并使用生命表如下所述累积分布函数。
累积风险率(故障率)
在每个周期的危险率是在给定的时间段在周期(以风险号)的开始幸存的个体数除以失败次数。
故障时间(Ť) | 风险率(H(Ť)) | 累积风险率 |
---|---|---|
0 | 0 | 0 |
Ť1 | d1/[R1 | d1/[R1 |
Ť2 | d2/[R2 | H(Ť1)+d2/[R2 |
... | ... | ... |
Ťñ | dñ/[Rñ | H(Ťñ- 1)+dñ/[Rñ |
生存概率
对于每一个时期,生存概率是风险率的补充产品。在第一时间段的开始时的初始生存概率是1,如果为每个周期的危险率是H(Ť一世),则幸存者概率是如图所示。
时间 (Ť) | 生存概率(小号(Ť)) |
---|---|
0 | 1 |
Ť1 | 1 *(1 -H(Ť1)) |
Ť2 | 小号(Ť1)*(1 -H(Ť2)) |
... | ... |
Ťñ | 小号(Ťñ- 1)*(1 -H(Ťñ)) |
累积分布函数
因为累积分布函数(CDF)和幸存者功能是彼此互补,您可以使用找到生命表的CDFF(Ť)= 1 -小号(Ť)。
你可以计算累积风险率,成活率,并在第一台模拟数据累积分布函数此页面上进行如下配置。
Ť | 多次失败(d) | 数以风险([R) | 风险率 | 生存概率 | 累积分布函数 |
---|---|---|---|---|---|
4 | 3 | 7 | 3/7 | 1 - 3/7 = 4/7 = 0.5714 | 0.4286 |
7 | 1 | 4 | 1/4 | 4/7 *(1 - 1/4)= 3/7 = 0.4286 | 0.5714 |
11 | 2 | 3 | 2/3 | 3/7 *(1 - 2/3)= 1/7 = 0.1429 | 0.8571 |
12 | 1 | 1 | 1/1 | 七分之一*(1 - 1)= 0 | 1 |
这个利率在这个例子是基于离散失败次数,从而计算不一定遵循基于导数的定义什么是生存分析?
这里是你如何可以进入数据和使用计算这些措施ECDF
。该数据并不一定是按升序排列。假设故障时间被存储在一个阵列ÿ
。
Y = [4 7 11 12];FREQ = [3 1 2 1];并[f,X] = ECDF(Y,'频率',频率)
F = 0 0.4286 0.5714 0.8571 1.0000 X = 4 4 7 11 12
当你删数据,生命表看起来可能像下面这样:
时间 (Ť) | 数失败(d) | 截尾 | 数以风险([R) | 风险率 | 生存概率 | 累积分布函数 |
---|---|---|---|---|---|---|
4 | 2 | 1 | 7 | 2/7 | 1 - 2/7 = 0.7143 | 0.2857 |
7 | 1 | 0 | 4 | 1/4 | 0.7143 *(1 - 1/4)= 0.5357 | 0.4643 |
11 | 1 | 1 | 3 | 2/3 | 0.5357 *(1 - 1/3)= 0.3571 | 0.6429 |
12 | 1 | 0 | 1 | 1/1 | 0.3571 *(1 - 1)= 0 | 1.0000 |
在任何给定时间,审查项目也以危险总数的考虑和危险率公式是基于失败的数量和风险的总数。虽然在每个周期的开始,在风险更新的数量,总数失败,在上期审查从数量在风险在那个时期开始减少。
在使用ECDF
,还必须输入使用二进制的数组变量的审查信息。1输入截尾数据,以及确切的故障时间输入0。
Y = [4 4 4 7 11 11 12];经社= [0 1 0 0 1 0 0];并[f,X] = ECDF(Y,“截尾”,中经社)
F = 0 0.2857 0.4643 0.6429 1.0000 X = 4 4 7 11 12
ECDF
默认情况下,产生的累积分布函数值。你必须指定幸存者功能或使用可选的名称 - 值对参数的风险函数。您也可以绘制如下的结果。
图()ECDF(Y,“截尾”,经社,'功能','幸存者');
图()ECDF(Y,“截尾”,经社,'功能',“累积风险”);
[1]考克斯,D.R。,和D.奥克斯。生存数据分析。伦敦:查普曼和霍尔,1984年。
[2] Lawless的,J. F.统计模型和寿命数据的方法。新泽西州霍博肯市:威利 - InterScience的,2002年。
[3] Kleinbaum,D.G。,和M.克莱因。生存分析。统计生物学和健康。第2版。斯普林格,2005。