主要内容

线性混合效应模型

线性混合效应模型是对分组收集和总结的数据的线性回归模型的扩展。这些模型描述了响应变量和自变量之间的关系,其系数可以随一个或多个分组变量而变化。混合效应模型由固定效应和随机效应两部分组成。固定效应术语通常是传统的线性回归部分,随机效应与从总体中随机抽取的单个实验单位相关。随机效应具有先验分布,而固定效应则没有。混合效应模型可以表示与数据分组相关的协方差结构,方法是将常见随机效应与具有相同分组变量级别的观察数据相关联。线性混合效应模型的标准形式是

y X β f x e d + Z b r 一个 n d o + ε e r r o r

在哪里

  • yn-by-1响应向量,和n是观测的数量。

  • X是一个n——- - - - - -p固定效果设计矩阵。

  • β是一个p-by-1固定效果向量。

  • Z是一个n——- - - - - -随机效应设计矩阵。

  • b是一个-by-1随机效果向量。

  • εn-by-1观测误差向量。

线性混合效应模型的假设如下:

  • 随机向量,b,误差向量,ε,具有以下先验分布:

    b N 0 σ 2 D θ ε N 0 σ 2

    在哪里D一个对称的正半定矩阵,由方差分量向量参数化θ是一个n——- - - - - -n单位矩阵,和σ2是误差方差。

  • 随机向量,b,误差向量,ε,是相互独立的。

混合效果模型也被称为混合效果模型多层次模型层次结构模型这取决于上下文。混合效应模型是一个比后两者更通用的术语。混合效应模型可能包括不一定是多层或分层的因素,例如交叉因素。这就是为什么混合效果是这里首选的术语。有时混合效应模型表示为同时拟合的多级回归模型(一级和分组级模型)。例如,具有一个连续预测变量的变化或随机截距模型x一个分组变量级别,可以表示为

y β 0 + β 1 x + ε 1 2 .. n 1 2 ... ε N 0 σ 2 β 0 β 00 + b 0 b 0 N 0 σ 0 2

在哪里y即时通讯与观测数据相对应和组n观察的总数和b0和ε即时通讯是相互独立的。将第一级模型中的组级参数代入后,得到响应向量的模型

y β 00 + β 1 x f x e d e f f e c t 年代 + b 0 r 一个 n d o e f f e c t 年代 + ε

具有一个连续预测变量的随机截距和斜率模型x,其中截距和斜率都由一个分组变量独立变化水平是

y β 0 + β 1 x + ε 1 2 ... n 1 2 ... ε N 0 σ 2 β 0 β 00 + b 0 b 0 N 0 σ 0 2 β 1 β 10 + b 1 b 1 N 0 σ 1 2

b b 0 b 1 N 0 σ 0 2 0 0 σ 1 2

你也可能有相关的随机效应。一般来说,对于具有随机截距和斜率的模型,随机效应的分布为

b b 0 b 1 N 0 σ D 2 θ

在哪里D一个2 × 2对称正半定矩阵,用方差分量向量参数化吗θ

在第一级模型中代入组级参数后,响应向量的模型为

y β 00 + β 10 x f x e d e f f e c t 年代 + b 0 + b 1 x r 一个 n d o e f f e c t 年代 + ε 1 2 ... n 1 2 ...

如果表达组级变量,x即时通讯,在随机效应术语中z即时通讯,此模型为

y β 00 + β 10 x f x e d e f f e c t 年代 + b 0 + b 1 z r 一个 n d o e f f e c t 年代 + ε 1 2 ... n 1 2 ...

在这种情况下,固定效应设计矩阵和随机效应设计矩阵中都出现了相同的术语。每一个z即时通讯而且x即时通讯对应等级分组变量的。

也可以通过添加更多的群体水平预测变量来解释更多的群体水平变化。具有一个连续预测变量的随机截距和随机斜率模型x,其中截距和斜率都由一个分组变量独立变化水平,以及一个群体水平预测变量v

y β 0 + β 1 x + ε 1 2 ... n 1 2 ... ε N 0 σ 2 β 0 β 00 + β 01 v + b 0 b 0 N 0 σ 0 2 β 1 β 10 + β 11 v + b 1 b 1 N 0 σ 1 2

该模型得到了组级预测器的主要效应,以及响应变量为时,模型中第一级和组级预测器变量之间的交互项

y β 00 + β 01 v + b 0 + β 10 + β 11 v + b 1 x + ε 1 2 ... n 1 2 ... β 00 + β 10 x + β 01 v + β 11 v x f x e d e f f e c t 年代 + b 0 + b 1 x r 一个 n d o e f f e c t 年代 + ε

这个词β11vx即时通讯在许多关于多层模型的教科书中通常称为跨层交互。响应变量的模型y可以表示为

y 1 x 1 v v x 1 β 00 β 10 β 01 β 11 + 1 x 1 b 0 b 1 + ε 1 2 ... n 1 2 ...

它与之前给出的标准形式相对应,

y X β + Z b + ε

一般来说,如果有R对变量分组,以及r)表示分组变量的级别r,供观察,然后建立观测响应变量模型

y x T β + r 1 R z r b r r + ε 1 2 ... n

在哪里β是一个p-by-1固定效果向量,brr是一个r的随机效果向量r分组变量和级别r),ε1乘1误差是观测的项吗

参考文献

j·C·皮涅里奥和d·m·贝茨。S和S- plus中的混合效应模型.统计与计算系列,施普林格,2004。

[2]哈里哈兰,S.和J. H.罗杰斯。递阶线性模型的估计方法教育数据的多层建模(A. A. Connell和D. B. McCoach主编)。北卡罗来纳州夏洛特:信息时代出版公司,2008年。

[3] Hox, J。多层次分析、技术与应用.Lawrence Erlbaum Associates, Inc., 2002

[4]斯奈德杰斯,T.和R.博斯克。多层次分析.加州千橡市:Sage出版社,1999年。

[5]盖尔曼,A. J.希尔。使用回归和多层/分层模型进行数据分析.纽约:剑桥大学出版社,2007年。

另请参阅

||

相关的话题