kaplan meier方法
统计和机器学习的工具箱™函数ecdf
生产经验累积风险,幸存者,通过使用kaplan meier和累积分布函数非参数方法。kaplan meier估计量的幸存者也叫函数采用估计量。
kaplan meier方法使用在生活中生存数据总结表。生命表顺序数据根据提升失败多次,但你没有进入失败/生存时间以有序的方式使用ecdf
。
一个生活表通常包括:
次失败
条目的数量一次失败/时间
条目的数量一次审查/时间
条目的数量在风险的开始时间/时期
幸存者的风险数量总数在每个周期的开始。风险数量开始第一节是所有个体的终身学习的过程。在每个的剩余期间的开始,风险数量减少的失败加上个人审查前一段的结束。
这生命表显示虚拟生存数据。在第一次失败的开始时间,有七个项目风险。4时,三个失败。所以在一开始的时候7,有四个项目的风险。只有一个失败时7,所以风险数量在一开始的时候11是三。两个失败时11,所以在一开始的时候12,数量是一个风险。剩下的12项失败时。
故障时间(t) | 失败的数量 | 数量风险 |
---|---|---|
4 | 3 | 7 |
7 | 1 | 4 |
11 | 2 | 3 |
12 | 1 | 1 |
你可以估计风险,累积风险,生存和累积分布函数使用表所描述的未来的生活。
累积风险率(故障率)
每个时期的故障率是失败的数量在给定的时期的数量除以幸存的人一开始的(风险)。
故障时间(t) | 风险率(h(t)) | 累积风险率 |
---|---|---|
0 | 0 | 0 |
t1 | d1/r1 | d1/r1 |
t2 | d2/r2 | h(t1)+d2/r2 |
… | … | … |
tn | dn/rn | h(tn- 1)+dn/rn |
生存概率
对于每个时期,生存概率的乘积的风险率。最初的生存概率的开头第一个时期是1。如果每个时期的故障率h(t我),然后幸存者概率如图所示。
时间(t) | 生存概率(年代(t)) |
---|---|
0 | 1 |
t1 | 1 * (1 -h(t1)) |
t2 | 年代(t1)* (1 -h(t2)) |
… | … |
tn | 年代(tn- 1)* (1 -h(tn)) |
累积分布函数
因为累积分布函数(cdf)和幸存者函数互为补充,你可以找到的cdf实验组的生命表使用F(t)= 1 -年代(t)。
可以计算累计风险率、存活率和模拟数据的累积分布函数在这个页面的第一个表如下。
t | 失败的数量(d) | 风险(r) | 故障率 | 生存概率 | 累积分布函数 |
---|---|---|---|---|---|
4 | 3 | 7 | 3/7 | 1 - 3/7 = 4/7 = 0.5714 | 0.4286 |
7 | 1 | 4 | 1/4 | 4/7 * (1 - 1/4)= 3/7 = .4286 | 0.5714 |
11 | 2 | 3 | 2/3 | 3/7 * (1 - 2/3)= 1/7 = 0.1429 | 0.8571 |
12 | 1 | 1 | 1/1 | 1/7 * (1 - 1)= 0 | 1 |
这个利率在这个例子中是基于离散失败多次,因此计算不一定遵循衍生的定义生存分析是什么?
这里是如何输入数据和计算这些措施使用ecdf
。数据并不一定要按升序。假设失败时报都存储在一个数组中y
。
y = [4 7 11 12];频率= [3 1 2 1];(f (x) = ecdf (y,“频率”、频率)
f = 0 0.4286 0.5714 0.8571 1.0000 x = 4 4 7 11 12
当你有审查数据,生命表的样子如下:
时间(t) | 失败的数量(d) | 审查 | 风险(r) | 故障率 | 生存概率 | 累积分布函数 |
---|---|---|---|---|---|---|
4 | 2 | 1 | 7 | 2/7 | 1 - 2/7 = 0.7143 | 0.2857 |
7 | 1 | 0 | 4 | 1/4 | 0.7143 * (1 - 1/4)= 0.5357 | 0.4643 |
11 | 1 | 1 | 3 | 1/3 | 0.5357 * (1 - 1/3)= 0.3571 | 0.6429 |
12 | 1 | 0 | 1 | 1/1 | 0.3571 * (1 - 1)= 0 | 1.0000 |
在任何给定的时间,审查项目也考虑数量的总风险,风险率公式是基于失败的数量和总数处于危险之中。同时更新数量风险在每个周期的开始,失败的总数和审查在前面的周期是减少数量的风险在这一时期的开始。
在使用ecdf
,你还必须进入审查信息使用二进制数组变量。输入1审查数据,并输入0确切的故障时间。
y = (4 4 4 7 11 11 12);岑= [0 1 0 0 1 0 0];(f (x) = ecdf (y,“审查”岑)
f = 0 0.2857 0.4643 0.6429 1.0000 x = 4 4 7 11 12
ecdf
默认情况下,产生的累积分布函数值。你必须指定幸存者函数或使用可选的名称-值对风险函数参数。你也可以画出结果如下。
图()ecdf (y,“审查”岑,“函数”,“幸存者”);
图()ecdf (y,“审查”岑,“函数”,“累积风险”);
引用
[1]考克斯·d·R。,and D. Oakes.生存数据的分析。伦敦:查普曼&大厅,1984。
[2]无法无天,j·F。寿命数据的统计模型和方法。新泽西州霍博肯:Wiley-Interscience, 2002年。
[3]Kleinbaum, d G。,m·克莱恩。生存分析。生物学和卫生统计,第二版。施普林格,2005年。