主要内容

线性混合效应模型中的参数估计

线性混合效应模型是表格

y = X β f x e d + Z b r 一个 n d o + ε. e r r o r ,

在哪里

  • y是个n- × 1响应向量n是观察人数。

  • X是一个n-经过-p固定后果设计矩阵。

  • β是一个p- 1个固定效果矢量。

  • Z是一个n-经过-随机效应设计矩阵。

  • b是一个1随机向量。

  • ε.是个n- × 1观测误差向量。

随机向量,b,误差向量,ε.假设具有以下独立的先前分布:

b ~ N ( 0 , σ. 2 D ( θ. ) ) , ε. ~ N ( 0 , σ. 2 ) ,

在哪里D是一个对称和正的半纤维矩阵,由方差分量矢量参数化θ.,是一个n-经过-n单位矩阵,σ.2为误差方差。

在该模型中,估计的参数是固定效果系数β,以及方差分量θ.σ.2。线性混合效应模型中参数估计的两个最常用的方法是最大可能性和限制最大似然方法。

最大可能性(ml)

最大似然估计包括回归系数和方差分量,即似然函数中既有固定效应项,也有随机效应项。

对于上述定义的线性混合效应模型,响应变量的条件响应y鉴于β,b,θ.,和σ.2

y | b , β , θ. , σ. 2 ~ N ( X β + Z b , σ. 2 n )

的可能性y鉴于β,θ.,和σ.2

P ( y | β , θ. , σ. 2 ) = P ( y | b , β , θ. , σ. 2 ) P ( b | θ. , σ. 2 ) d b ,

在哪里

P ( b | θ. , σ. 2 ) = 1 ( 2 π σ. 2 ) 2 1 | D ( θ. ) | 1 2 经验值 { 1 2 σ. 2 b T D 1 b } P ( y | b , β , θ. , σ. 2 ) = 1 ( 2 π σ. 2 ) n 2 经验值 { 1 2 σ. 2 ( y X β Z b ) T ( y X β Z b ) }

假设λ(θ.的下三角形乔列斯基因子D(θ.)和Δ(θ.)是Λ(θ.)。然后,

D ( θ. ) 1 = δ. ( θ. ) T δ. ( θ. )

定义

r 2 ( β , b , θ. ) = b T δ. ( θ. ) T δ. ( θ. ) b + ( y X β Z b ) T ( y X β Z b ) ,

假设b*是价值b满足

r 2 ( β , b , θ. ) b | b * = 0

给予βθ.。然后,可能性函数是

P ( y | β , θ. , σ. 2 ) = ( 2 π σ. 2 ) n 2 | D ( θ. ) | 1 2 经验值 { 1 2 σ. 2 r 2 ( β , b * ( β ) , θ. ) } 1 | δ. T δ. + Z T Z | 1 2

P (y |β,θ.2)首先是最大化的β和σ2对于给定的θ.。因此优化的解决方案金宝搏官方网站 β ^ ( θ. ) σ. ^ 2 ( θ. ) 得到的函数是θ.。将这些解代入似然函数得到金宝搏官方网站 P ( y | β ^ ( θ. ) , θ. , σ. ^ 2 ( θ. ) ) 。这个表达式叫做轮廓似然β和σ2已经被侧写出来了。 P ( y | β ^ ( θ. ) , θ. , σ. ^ 2 ( θ. ) ) 是一个函数θ.,并且算法然后优化它θ.。一旦它找到最佳估计θ.,估计β和σ2是由 β ^ ( θ. ) σ. ^ 2 ( θ. )

ML方法处理β当方差分量被估计时作为固定但未知的量,但不考虑因估计固定效应而损失的自由度。这导致ML估计具有较小的偏差。然而,ML相对于REML的一个优势是可以比较两个模型的固定和随机效应。另一方面,如果您使用REML来估计参数,您只能比较两个模型,它们嵌套在它们的随机效应项中,具有相同的固定效应设计。

限制性最大似然(REML)

限制极大似然估计只包括方差分量,即线性混合效应模型中参数化随机效应项的参数。β估计在第二步。假设均匀的不当分发β并对概率P(y|β,θ.2) 关于β,得到限制似然P(y|θ.2)。也就是说,

P ( y | θ. , σ. 2 ) = P ( y | β , θ. , σ. 2 ) P ( β ) d β = P ( y | β , θ. , σ. 2 ) d β

算法首先进行配置 σ. ^ R 2 并最大限度地提高剩余的目标函数θ.找到 θ. ^ R 。然后限制似然相对于σ最大2找到 σ. ^ R 2 。然后,它估计β通过在后部分布上找到其预期值

P ( β | y , θ. ^ R , σ. ^ R 2 )

REML解释了通过估计固定效应而失去的自由度,并对随机效应方差进行了较小的偏倚估计。的估计θ.和σ2是不变的值β与ML估计相比,对数据中的异常值不那么敏感。然而,如果使用REML来估计参数,则只能比较具有相同固定效应设计矩阵并嵌套在其随机效应项中的两个模型。

参考

[1] Pinherio,J.C和D. M. Bates。S和S- plus混合效应模型。统计和计算系列,Springer,2004。

Hariharan, S.和J. H. Rogers。层次线性模型的估计程序教育数据的多级建模(A. A. Connell和D. B.McCoach,Eds。)。夏洛特,NC:信息时代Publishing,Inc.,2008。

[3] Raudenbush, S. W.和A. S. Bryk。层次线性模型:应用与数据分析方法,第二次。千橡木,加利福尼亚州:Sage Publications,2002年。

[4] Hox,J.多层分析,技术和应用。Lawrence Erlbaum Associates, Inc, 2002。

[5]斯奈德,T.和R.博斯克。多层次分析。千橡木,加利福尼亚州:1999年Sage Publications,1999年。

[6] McCulloch, c.e., r.s. Shayle和J. M. Neuhaus。广义,线性和混合模型。Wiley,2008。

另请参阅

||

相关话题