主要内容

截尾数数据的Cox比例风险模型

这个例子展示了如何构建Cox比例风险模型,并评估预测变量的重要性。

步骤1。加载示例数据。

加载示例数据。

负载readmissiontimes

响应变量为ReadmissionTime,显示了100名患者的再入院时间。预测变量是年龄重量,以及每位患者的吸烟情况,吸烟者.1表示吸烟者,0表示不吸烟。列向量审查有每个患者的审查信息,其中1表示审查数据,0表示观察到的确切再入院时间。这是模拟数据。

步骤2。拟合Cox比例风险函数。

拟合Cox比例风险函数,以变量Sex为预测变量,并考虑截尾。

X =性;[b, logl H,统计]= coxphfit (X, ReadmissionTime“审查”、审查);

评估“性别”一词的统计学意义。

统计数据
统计=结构体字段:covb: 0.1016 beta版:-1.7642 se: 0.3188 z: -5.5335 p: 3.1392 e-08 csr: x1双[100]devres: x1双[100]martres: x1双[100]薛定:x1双[100]sschres: [100 x1双)得分:x1双[100]sscores: e-09 x1双[100]LikelihoodRatioTestP: 5.9825

p 值,p,表明“性别”一词具有统计学意义。

使用不同的名称保存日志可能性值。您将使用它来评估扩展模型的重要性。

loglSex = logl
loglSex = -262.1365

步骤3。给模特添加年龄和体重。

用性别、年龄和体重变量拟合Cox比例风险模型。

X =[性别年龄体重];[b, logl H,统计]= coxphfit (X, ReadmissionTime“审查”、审查);

评估条款的重要性。

stats.beta
ans =3×1-0.5441 0.0143 0.0250
stats.p
ans =3×10.4953 0.3842 0.0960

这些术语经其他术语调整后,没有一个在统计上具有显著意义。

使用对数似然比评估这些项的重要性。您可以使用似然比统计量来评估新模型的重要性。首先找出不包含年龄和权重的模型的对数似然统计量与包含性别、年龄和权重的模型的对数似然统计量之间的差异。

2 * [loglSex - logl]
ans = 3.6705

现在,计算 p -似然比统计值。似然比统计具有卡方分布,其自由度等于被评估的预测变量的数量。在这种情况下,自由度是2。

P = 1 - cdf(“chi2”, 3.6705, 2)
p = 0.1596

p -值为0.1596表示年龄和体重这两个术语在统计上不显著,因为模型中的术语是性别。

步骤4。将吸烟者添加到模型。

拟合Cox比例风险模型与变量性和吸烟者。

X =[性吸烟者];[b, logl H,统计]= coxphfit (X, ReadmissionTime...“审查”、审查);

评估模型中术语的重要性。

stats.p
ans =2×10.0000 - 0.0148

将这个模型与第一个模型进行比较,第一个模型中只有Sex这个术语。

2 * [loglSex - logl]
ans = 5.5789

计算 p -似然比统计值。似然比统计量具有自由度为1的卡方分布。

P = 1 - cdf(“chi2”, 5.5789, 1)
p = 0.0182

p -值为0.0182表示性别和吸烟者在统计学上是显著的,因为另一个在模型中。带有性和吸烟者的模型比只有性的模型更适合。

请求系数估计。

stats.beta
ans =2×1-1.7165 - 0.6338

默认基线是的平均值X,所以最终的风险比模型是

H R h X t h X t 经验值 β 年代 X 年代 - X 年代 + β α X α - X α

拟合Cox比例风险模型的基线为0。

X =[性吸烟者];[b, logl H,统计]= coxphfit (X, ReadmissionTime...“审查”审查,“基线”, 0);

风险比的模型为

H R h X t h 0 t 经验值 β 年代 X 年代 + β α X α

请求系数估计。

stats.beta
ans =2×1-1.7165 - 0.6338

系数不受影响,但危险率与基线为平均值时不同X

另请参阅

||

相关的例子

更多关于