主要内容

什么是生存分析?

介绍

生存分析是时间到事件的分析,也就是说,当关注的结果是事件发生之前的时间。从时间到事件的例子有:在健康科学中,直到感染、疾病复发或康复的时间;在经济学中,到失业的持续时间;在工程中,到机器部件故障的时间或灯泡的寿命,等等。生存分析是工程可靠性研究的一部分。在这种情况下,它通常用于研究工业部件的寿命。在可靠性分析中,生存时间通常被称为故障时间,因为关心的变量是组件在故障发生前正常工作的时间。

生存分析包括参数,半甲型和非参数方法。您可以使用这些来估计生存研究中最常用的措施,幸存者和危险功能,将它们与不同的群体进行比较,并评估预测变量与生存时间的关系。一些统计概率分布描述了存活时间。常用的分布是指数级,威布尔,逻辑,毛刺和Birnbaum-Saunders分布。统计和机器学习工具箱™功能ecdf.ksdensity计算cdf、累积危险和幸存者函数的经验和核密度估计。coxphfit将Cox比例风险模型与数据进行拟合。

审查

存活分析中的一个重要概念是审查。由于不同的原因,某些个体的存活时间可能无法完全观察到。我n life sciences, this might happen when the survival study (e.g., the clinical trial) stops before the full survival times of all individuals can be observed, or a person drops out of a study, or for long-term studies, when the patient is lost to follow up. In the industrial context, not all components might have failed before the end of the reliability study. In such cases, the individual survives beyond the time of the study, and the exact survival time is unknown. This is called right censoring.

在生存研究中要么个体被观察到失败T或者对那些个人停止的观察c.则观察值为最小值(Tc)和指示变量c显示个人是否被审查。危险函数和幸存函数的计算必须进行调整,以考虑到审查。统计和机器学习工具箱功能,如ecdf.ksdensitycoxphfit, 和大中型企业占审查。

数据

生存数据通常包括在发生感兴趣事件的时间和每个个人或组件的审查信息。下表显示了6个月的研究中个人的虚拟失业时间。两名个人被审查(由审查价值为1)。学习结束后24周后,一个人仍失业。与其他审查的个人联系在21周末丢失。

失业时间(周) 审查
14 0
23 0
7 0
21 1
19 0
16 0
24 1
8 0

生存数据还可能包括在特定时间内的故障数量(观察到特定生存或故障时间的次数)。下表显示了在加速寿命测试中,发光二极管降到其全光输出水平的70%(以小时为单位)时的模拟时间。

故障时间(小时) 频率
8600. 6
15300 19
22000. 11
28600 20.
35300 17
42000 14
48700 8
55400. 2
62100 0
68800 2

数据还可能有关于预测变量的信息,以用于半参数回归的方法,例如Cox比例危险回归。

恢复时间(周) 审查 性别 收缩压 舒张压血压
12 1 男性 124 93.
20. 0 109 77
7 0 125 83
13 0 男性 117 75
9 1 男性 122 80
15 0 121 70
17 1 男性 130 88
8 0 115 82
14 0 男性 118 86

幸存者功能

生存函数是生存概率与时间的函数。它也被称为生存函数。它给出了个体存活时间超过某一数值的概率。由于累积分布函数,Ft),是生存时间小于或等于给定时间点的概率,是连续分布的生存函数,年代t),是累积分布函数的补充:

年代t) = 1 -Ft)。

幸存者函数也与风险函数.如果数据具有危险函数,ht),则幸存者函数为

年代 t ) 经验值 0 t h u ) d u )

这对应于

年代 t ) 经验值 H t ) )

在哪里Ht)为累积风险函数。

毛刺分布幸存者函数

计算和绘制与参数的毛刺分布的幸存功能503., 和1

x = 0:0.1:200;图()图(x, 1-cdf (“毛刺”x 50 - 3, - 1))包含(“失败时间”);ylabel (“存活率”);

图中包含一个轴对象。axis对象包含一个类型为line的对象。

来自数据的幸存者函数

这个例子展示了如何根据数据估计幸存者函数。

加载样本数据。

负载Readmission it.

列向量ReadmissionTime.显示了100名患者的再入院时间。列向量审查是否具有每个患者的审查信息,其中1表示缩短的数据,并且0表示观察到精确的读取时间。模拟此数据。

(ReadmissionTime审查)
ans =100×25 1 3 1 19 0 17 0 9 0 16 0 4 0 2 0 3 0 15 0⋮

前两次再入院53.,都被审查了。

使用审查使用审查经验幸存者功能ecdf.使用名称值对参数“函数”、“幸存者”审查,审查

ecdf(ReadmissionTime,“审查”,审查,'功能'“幸存者”)

图中包含一个轴对象。轴对象包含类型阶段的对象。

风险函数

危险函数给出了个体的瞬时失败率,其条件是个体存活到给定时间。也就是说,

h t ) lim δ. t 0 P t T < t + δ. t | T t ) δ. t

Δ在哪里t是一个非常小的时间间隔。因此,危险率有时被称为条件失败率。风险函数总是取正值。但是,这些值与概率不对应,可能大于1。

风险函数与概率密度函数有关,ft), 累积分布函数,Ft)和幸存者函数,年代t), 如下:

h t ) f t ) 年代 t ) f t ) 1 F t )

哪个也等于

h t ) d d t LN. 年代 t )

因此,如果您知道生存函数的形状,您还可以派生相应的危险功能。

毛刺分布危险功能

计算并绘制带有参数的毛刺分布的危险函数503., 和1

x = 0:1:200;Burrhazard = PDF(“毛刺”x 50 3,1) / (1-cdf (“毛刺”x 50 - 3, - 1));图()图(x, Burrhazard)包含(“失败时间”);ylabel ('危险率');

图中包含一个轴对象。axis对象包含一个类型为line的对象。

威布尔风险函数

有不同类型的危险函数。上图显示了一种情况,当危险率在早期时期上升,然后逐渐下降。危险率也可能随时间单调降低、增加或不变。下图展示了来自不同威布尔分布的数据的不同类型危险函数的示例。

图ax1 = subplot(3,1,1);x1 = 0:0.05:10;hazard1 = pdf ('WBL'x1 3 0.6)。/ (1-cdf ('WBL',x1,3,0.6));绘图(X1,Hazard1,“颜色”“b”)设置(ax₁,“Ylim”0.6 [0]);传奇(AX1,= 3, b = 0.6的);ax2 =次要情节(3、1、2);x2 = 0:0.05:10;hazard2 = pdf ('WBL',x2,9,4)./(1-CDF('WBL',x2,9,4));绘图(X2,Hazard2,“颜色”“r”)设置(ax2,“Ylim”0.6 [0]);传奇(ax2,“= 9,b = 4”'地点''东南');AX3 =子图(3,1,3);X3 = 0:0.05:10;Hazard3 = PDF('WBL'x3, 2.5, 1)。/ (1-cdf ('WBL',x3,2.5,1));绘图(X3,Hazard3,“颜色”‘g’)设置(ax3“Ylim”0.6 [0]);传奇(ax3“b = 2.5, = 1”);

图包含3个轴对象。轴对象1包含类型线的对象。该对象表示a = 3,b = 0.6。轴对象2包含类型线的对象。该对象表示a = 9,b = 4。轴对象3包含类型线的对象。该对象表示a = 2.5,b = 1。

在第三种情况下,威布尔分布具有形状参数值1,对应于指数分布。随着时间的推移,指数分布总是有一个恒定的风险率。

参考文献

d·R·考克斯和d·奥克斯。存活数据分析.伦敦:1984年Chapman&Hall。

[2]律,J.F。终生数据的统计模型和方法.Hoboken,NJ:Wiley-Interscience,2002。

[3] Kleinbaum,D。G.和M. Klein。生存分析.生物学与健康的统计数据。第2版​​。Springer,2005年。

另请参阅

||

相关的例子

更多关于