这个例子展示了如何构建Cox比例风险模型,并评估预测变量的重要性。
加载示例数据。
负载readmissiontimes
响应变量为ReadmissionTime
,显示了100名患者的再入院时间。预测变量是年龄
,性
,重量
,以及每位患者的吸烟情况,吸烟者
.1表示吸烟者,0表示不吸烟。列向量审查
有每个患者的审查信息,其中1表示审查数据,0表示观察到的确切再入院时间。这是模拟数据。
拟合Cox比例风险函数,以变量Sex为预测变量,并考虑截尾。
X =性;[b, logl H,统计]= coxphfit (X, ReadmissionTime“审查”、审查);
评估“性别”一词的统计学意义。
统计数据
统计=结构体字段:covb: 0.1016 beta版:-1.7642 se: 0.3188 z: -5.5335 p: 3.1392 e-08 csr: x1双[100]devres: x1双[100]martres: x1双[100]薛定:x1双[100]sschres: [100 x1双)得分:x1双[100]sscores: e-09 x1双[100]LikelihoodRatioTestP: 5.9825
的
值,p
,表明“性别”一词具有统计学意义。
使用不同的名称保存日志可能性值。您将使用它来评估扩展模型的重要性。
loglSex = logl
loglSex = -262.1365
用性别、年龄和体重变量拟合Cox比例风险模型。
X =[性别年龄体重];[b, logl H,统计]= coxphfit (X, ReadmissionTime“审查”、审查);
评估条款的重要性。
stats.beta
ans =3×1-0.5441 0.0143 0.0250
stats.p
ans =3×10.4953 0.3842 0.0960
这些术语经其他术语调整后,没有一个在统计上具有显著意义。
使用对数似然比评估这些项的重要性。您可以使用似然比统计量来评估新模型的重要性。首先找出不包含年龄和权重的模型的对数似然统计量与包含性别、年龄和权重的模型的对数似然统计量之间的差异。
2 * [loglSex - logl]
ans = 3.6705
现在,计算 -似然比统计值。似然比统计具有卡方分布,其自由度等于被评估的预测变量的数量。在这种情况下,自由度是2。
P = 1 - cdf(“chi2”, 3.6705, 2)
p = 0.1596
的 -值为0.1596表示年龄和体重这两个术语在统计上不显著,因为模型中的术语是性别。
拟合Cox比例风险模型与变量性和吸烟者。
X =[性吸烟者];[b, logl H,统计]= coxphfit (X, ReadmissionTime...“审查”、审查);
评估模型中术语的重要性。
stats.p
ans =2×10.0000 - 0.0148
将这个模型与第一个模型进行比较,第一个模型中只有Sex这个术语。
2 * [loglSex - logl]
ans = 5.5789
计算 -似然比统计值。似然比统计量具有自由度为1的卡方分布。
P = 1 - cdf(“chi2”, 5.5789, 1)
p = 0.0182
的 -值为0.0182表示性别和吸烟者在统计学上是显著的,因为另一个在模型中。带有性和吸烟者的模型比只有性的模型更适合。
请求系数估计。
stats.beta
ans =2×1-1.7165 - 0.6338
默认基线是的平均值X
,所以最终的风险比模型是
拟合Cox比例风险模型的基线为0。
X =[性吸烟者];[b, logl H,统计]= coxphfit (X, ReadmissionTime...“审查”审查,“基线”, 0);
风险比的模型为
请求系数估计。
stats.beta
ans =2×1-1.7165 - 0.6338
系数不受影响,但危险率与基线为平均值时不同X
.