考克斯比例风险模型
简介
Cox比例危险回归是一种半参数方法,用于调整生存率估计,以量化预测变量的影响。该方法将解释变量的影响表示为公共基线危险函数的乘数,h0年代ub>(t).风险函数是Cox比例风险回归函数的非参数部分,而预测变量的影响是一个对数线性回归。对于相对于0的基线,此模型对应于
在哪里<年代pan class="inlineequation"> 预测变量是我th主题,h(X我,t)为当时的危险率t为X我,h0年代ub>(t)为基线危害率函数。
若要将Cox比例风险模型与数据拟合,请使用coxphfit
函数或fitcox
函数。的fitcox
函数更现代,返回一个CoxModel
对象,其中包含关于模型的详细信息。例如,使用fitcox
,请参阅Cox比例风险模型对象.
风险比
考克斯比例危险模型将个人或物品的危险率与该值联系起来X我,以个人或物品的危害率为基线值。它产生了对危险比的估计:
该模型基于一个假设,即基线危险函数取决于时间,t,但预测变量没有。这种假设也被称为比例风险假设,即任何个体的风险比不随时间变化。
风险比表示具有预测变量值的个人或项目瞬时失效的相对风险X我与那些有基线值的人相比。例如,如果预测变量为吸烟状态,其中不吸烟为基线类别,则风险比显示吸烟者与基线类别(即不吸烟)相比的相对瞬时失败率。的基线X*年代up>和预测变量值X我,风险比为
例如,如果基线是预测变量的平均值(意思是(X)
),则风险比为
危险率是与生存率有关的,这样,生存率在时间t对于具有解释变量值的个体X我是
在哪里年代0年代ub>(t)为具有基线危险率函数的幸存者函数h0年代ub>(t),人力资源(X我)为预测变量值的风险比X我相对于基线值。
Cox比例风险模型的扩展
当有变量不满足比例风险(PH)假设时,可以考虑使用Cox比例风险模型的两个扩展:分层Cox模型和带时间变量的Cox模型。
如果不满足PH值假设的变量是可分类的,则使用分层Cox模型:
下标在这里年代表示年代地层。分层Cox模型对每个地层有不同的基线危险率函数,但系数相同。因此,当预测变量值相同时,各地层的风险比是相同的。中可以包含分层变量coxphfit
通过使用名称-值对“层”
.有关使用带有Cox模型对象的分层Cox模型的示例,请参见Cox比例风险模型对象.
如果不满足PH假设的变量是时变变量,则使用带时变变量的Cox模型:
在哪里xij是一个与时间无关的预测因子吗x本土知识(t)是时间依赖预测器的一个元素。关于如何将时间相关变量包含在coxphfit
,请参阅具有时变协变量的Cox比例风险模型.
部分似然函数
每个解释变量效应的点估计,即每个解释变量效应的估计风险比为exp(b),假设所有其他变量保持不变,其中b是该变量的系数估计。通过最大化模型的部分似然函数来求得系数估计值。比例风险回归模型的部分似然函数基于事件的观察顺序。它是每个故障时间估计的部分故障可能性的乘积。如果有n失败在n不同的故障时间,<年代pan class="inlineequation"> ,则部分似然为
你可以用风险集重写部分可能性R我:
在哪里R我表示正在研究但直到事件才经历该事件的主题的索引集我故障时间。
您可以使用似然比检验来评估在模型中添加一个或多个术语的重要性。考虑第一个模型所包含的两个模型p预测变量和第二个模型有p+r预测变量。然后,比较两个模型,-2 *(l1年代ub>/l2年代ub>)具有卡方分布r自由度(测试项的数量)。
捆绑事件的部分似然函数
当比赛项目打成平手时,coxphfit
通过Breslow方法(默认)或Efron方法近似模型的部分似然,而不是计算准确的部分似然。计算精确的部分似然需要大量的计算,这涉及到捆绑事件时间的风险集的整个排列。
最简单的近似方法是布雷斯洛方法。该方法对每个绑定集使用相同的分母。
在哪里d是不同事件的次数,和D我事件时间等于的所有主题的索引集我事件时间。
埃夫隆的方法比布雷斯洛的方法更准确,但也更简单。该方法调整绑定事件的分母,如下所示:
在哪里d我索引的数量在吗D我.
例如,假设前两个事件是相同的,也就是说,t1年代ub>=t2年代ub>而且<年代pan class="inlineequation"> .在Breslow的方法中,前两项的分母是相同的:
Efron的方法调整了第二项的分母:
可以使用名称-值对指定近似方法“关系”
在coxphfit
.
观察的频率或权重
Cox比例风险模型可以与观测的频率或权重相结合。让w我的重量我观察。那么,带权重的Cox模型的部分似然为:
带权重的部分似然
在哪里
权重的部分似然和布雷斯洛方法
加权偏似然法和Efron法
您可以使用名称-值对指定观测的频率或权重“频率”
在coxphfit
.
参考文献
[1]考克斯,D. R.和D.奥克斯。生存数据分析.伦敦:查普曼和霍尔,1984。
[2] j.f.劳里斯寿命数据的统计模型和方法.霍博肯,新泽西州:Wiley-Interscience, 2002。
[3]克莱因鲍姆,d.g.和M.克莱因。生存分析.《生物与健康统计》第二版。施普林格,2005年。
[4]克莱因,J. P.和M. L.莫什伯格。生存分析.《生物与健康统计》第二版。施普林格,2003年。
另请参阅
ecdf
|<年代pan itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">coxphfit
|<年代pan itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">ksdensity