主要内容

线性Mixed-Effects模型工作流

这个例子展示了如何适应和分析线性mixed-effects模型(LME)。

加载示例数据。

负载流感

流感数组数据集有一个日期变量,和10个变量包含估计流感率(在9个不同的地区,估计从Google®搜索,加上全国估计来自CDC)。

重组和画出数据。

适合一个线性混合效应模型,数据必须在正确格式化的数据集的数组。适合一个线性mixed-effects模型与流感率响应,结合九列区域对应到一个数组中。新数据集的数组,flu2,必须响应变量FluRate名义变量地区显示每个估计来自哪个区域,全国估计WtdILI和分组变量日期

2:10 flu2 =堆栈(流感,“NewDataVarName”,“FluRate”,“IndVarName”,“地区”);flu2。日期= nominal(flu2.Date);

定义flu2作为一个

flu2 = dataset2table (flu2);

流感发病率与全国估计的阴谋。

情节(flu2.WtdILI flu2.FluRate,“罗”)包含(“WtdILI”)ylabel (“流感率”)

您可以看到流感发病率的地区与全国估计有直接关系。

符合LME模型和解释结果。

适合全国范围内的估计线性mixed-effects模型作为预测变量和随机截距不同日期

lme = fitlme (flu2,“FluRate ~ 1 + WtdILI +(1 |日期)”)
lme =线性mixed-effects模型适合毫升模型信息:观察468固定效应系数2 52协方差参数随机效应系数公式:FluRate ~ 1 + WtdILI +(1 |日期)模型适合统计:AIC BIC LogLikelihood异常固定效应系数286.24 302.83 -139.12 278.24 (95% CIs):名字估计SE tStat DF pValue{(拦截)的}466 0.16385 0.057525 2.8484 0.0045885 {‘WtdILI} 0.7236 0.032219 22.459 466 3.0502 e - 76低上0.050813 - 0.27689 0.66028 - 0.78691随机效应方差参数(95% CIs):组:日期(52水平)Name1 Name2类型估计{(拦截)的}{(拦截)的}{“性病”}0.17146低上0.13227 - 0.22226组:错误的名字估计低上{“Res性病”}0.30201 0.28217 0.32324

$ p $0.0045885和3.0502 e - 76值表明,拦截和全国估计意义重大。此外,置信区间标准偏差的随机项,$ \ sigma_ {b} $,不包括0(0.13227,0.22226),这表明随机项是重要的。

原始残差与拟合值的阴谋。

图();plotResiduals (lme,“安装”)

残差的方差拟合响应值增加而增加,这就是所谓的异方差性。

找到两个观测右上角出现像离群值。

找到(残差(lme) > 1.5)
ans = 98 107

改装模型通过消除这些观察。

lme = fitlme (flu2,“FluRate ~ 1 + WtdILI +(1 |日期)”,“排除”[98107]);

改进模型。

确定包括一个独立的随机项全国估计分组日期提高了模型。

altlme = fitlme (flu2,“FluRate ~ 1 + WtdILI +(1 |日期)+ (WtdILI-1 |日期)”,“排除”[98107])
altlme =线性mixed-effects模型适合毫升模型信息:观察466固定效应系数2 104协方差参数随机效应系数公式:FluRate ~ 1 + WtdILI +(1 |日期)+ (WtdILI |日期)模型适合统计:AIC BIC LogLikelihood异常固定效应系数179.39 200.11 -84.694 169.39 (95% CIs):名字估计SE tStat DF pValue{(拦截)的}464 0.17837 0.054585 3.2676 0.001165 {‘WtdILI} 0.70836 0.030594 23.153 464 2.123 e - 79低上0.0711 - 0.28563 0.64824 - 0.76849随机效应方差参数(95% CIs):组:日期(52水平)Name1 Name2类型估计{(拦截)的}{(拦截)的}{“性病”}0.16631低上0.12977 - 0.21313组:日期(52水平)Name1 Name2类型估计低{‘WtdILI} {‘WtdILI}{“性病”}4.6672 e-08南上南组:错误的名字估计低上{“Res性病”}0.26691 0.24934 0.28572

估计的标准偏差WtdILI项几乎是0,无法计算的置信区间。这是一个迹象表明模型是overparameterized(WtdILI-1 |日期)术语并不重要。你可以使用正式的测试比较方法如下:比较(lme, altlme CheckNesting,真的)

添加一个随机effects-term拦截按地区分组初始模型lme三个月

lme2 = fitlme (flu2,“FluRate ~ 1 + WtdILI +(1 |日期)+(1 |地区)',“排除”[98107]);

比较模型lme三个月lme2

比较(lme lme2,“CheckNesting”,真正的)
ans =理论模型的似然比检验DF AIC BIC LogLik LRStat deltaDF pValue lme 4 177.39 193.97 -84.694 lme2 5 62.265 82.986 -26.133 117.12 1 0

$ p $值0表示lme2是一个更好的选择比吗lme三个月

现在,检查是否添加一个潜在相关随机的拦截和全国平均水平提高了模型lme2

lme3 = fitlme (flu2,“FluRate ~ 1 + WtdILI +(1 |日期)+ (1 + WtdILI |地区)”,“排除”[98107])
lme3 =线性mixed-effects模型适合毫升模型信息:观察466固定效应系数2 70协方差参数随机效应系数公式:FluRate ~ 1 + WtdILI +(1 |日期)+ (1 + WtdILI |地区)模型适合统计:AIC BIC LogLikelihood异常固定效应系数13.338 42.348 0.33076 -0.66153 (95% CIs):名字估计SE tStat DF pValue{(拦截)的}464 0.1795 0.054953 3.2665 0.0011697 {‘WtdILI} 0.70719 0.04252 16.632 464 4.6451 e-49低上0.071514 - 0.28749 0.62363 - 0.79074随机效应方差参数(95% CIs):组:日期(52水平)Name1 Name2类型估计{(拦截)的}{(拦截)的}{“性病”}0.17634低上0.14093 - 0.22064组:区域(9)水平Name1 Name2类型估计{(拦截)的}{(拦截)的}{“性病”}0.0077037 {‘WtdILI}{(拦截)的}{“相关系数”}-0.059603 {‘WtdILI} {‘WtdILI}{“性病”}0.088069低上3.1945 e-16 1.8578 e + 11 -0.99996 0.99995 0.051693 0.15004组:错误的名字估计低上{“Res性病”}0.20976 0.19568 0.22486

估计的标准偏差随机拦截按地区分组是0.0077037,它的置信区间是非常大的,包括零。这表明拦截按地区分组的随机影响微不足道。的随机拦截和之间的相关性WtdILI是-0.059604。其置信区间也很大,包括零。这是一个迹象表明相关性不显著。

改装模型通过消除的拦截(1 + WtdILI |地区)随机项。

lme3 = fitlme (flu2,“FluRate ~ 1 + WtdILI +(1 |日期)+ (WtdILI - 1 |地区)',“排除”[98107])
lme3 =线性mixed-effects模型适合毫升模型信息:观察466固定效应系数2 61协方差参数随机效应系数公式:FluRate ~ 1 + WtdILI +(1 |日期)+ (WtdILI |地区)模型适合统计:AIC BIC LogLikelihood异常固定效应系数9.3395 30.06 0.33023 -0.66046 (95% CIs):名字估计SE tStat DF pValue{(拦截)的}464 0.1795 0.054892 3.2702 0.0011549 {‘WtdILI} 0.70718 0.042486 16.645 464 4.0496 e-49低上0.071637 - 0.28737 0.62369 - 0.79067随机效应方差参数(95% CIs):组:日期(52水平)Name1 Name2类型估计{(拦截)的}{(拦截)的}{“性病”}0.17633低上0.14092 - 0.22062组:区域(9)水平Name1 Name2类型估计低{‘WtdILI} {‘WtdILI}{“性病”}0.087925 - 0.054474上0.14192组:错误的名字估计低上{“Res性病”}0.20979 0.19585 0.22473

所有条款在新的模型lme3是重要的。

比较lme2lme3

比较(lme2 lme3,“CheckNesting”,真的,“NSim”,100)
ans =模拟的似然比检验:NSIM = 100,α= 0.05模型DF AIC BIC LogLik LRStat pValue lme2 5 62.265 82.986 -26.133 lme3 5低9.3395 30.06 0.33023 52.926 - 0.009901 0.00025064 - 0.053932

$ p $0.009901显示的值lme3是一个更好的选择比吗lme2

二次固定后果项添加到模型中lme3

lme4 = fitlme (flu2,“FluRate ~ 1 + WtdILI ^ 2 +(1 |日期)+ (WtdILI - 1 |地区)',“排除”[98107])
lme4 =线性mixed-effects模型适合毫升模型信息:观察466固定效应系数3 61协方差参数随机效应系数公式:FluRate ~ 1 + WtdILI + WtdILI ^ 2 +(1 |日期)+ (WtdILI |地区)模型适合统计:AIC BIC LogLikelihood异常固定效应系数6.7234 31.588 2.6383 -5.2766 (95% CIs):名字估计SE tStat DF pValue{(拦截)的}463 -0.063406 0.12236 -0.51821 0.60456 {‘WtdILI} 1.0594 0.16554 6.3996 463 3.8232平台以及{“WtdILI ^ 2》} -0.096919 0.0441 -2.1977 463 0.028463低上-0.30385 0.17704 0.73406 1.3847 -0.18358 -0.010259随机效应方差参数(95% CIs):组:日期(52水平)Name1 Name2类型估计{(拦截)的}{(拦截)的}{“性病”}0.16732低上0.13326 - 0.21009组:区域(9)水平Name1 Name2类型估计低{‘WtdILI} {‘WtdILI}{“性病”}0.087865 - 0.054443上0.1418组:错误的名字估计低上{“Res性病”}0.20979 0.19585 0.22473

$ p $价值0.028463表明二次项的系数WtdILI ^ 2是显著的。

画出拟合响应与观察到的反应和残差。

F =安装(lme4);R =响应(lme4);图();情节(R、F“处方”)包含(“响应”)ylabel (“安装”)

安装与观察到的响应值几乎形成45度角指示一个不错的选择。

残差与拟合值的阴谋。

图();plotResiduals (lme4“安装”)

虽然改善了,你仍然可以看到一些在模型中异方差性。这可能是由于另一个预测中不存在的数据集,因此不模型中。

找到安装地区ENCentral流感率值,11/6/2005日期。

F (flu2。地区==“ENCentral”& flu2。日期= =“11/6/2005”)
ans = 1.4860

随机生成响应值。

随机生成响应值对于一个国家的估计1.625,4/23/2006地区MidAtl和日期。首先,定义新表。因为日期和地区名义在原来的表,你必须定义他们同样在新表中。

tblnew。日期= nominal(“4/23/2006”);tblnew。WtdILI= 1.625; tblnew.Region = nominal(“MidAtl”);tblnew = struct2table (tblnew);

现在,生成响应值。

随机(lme4 tblnew)
ans = 1.2679