主要内容

线性回归与交互效应

用交互效应构建和分析线性回归模型,解释结果。

加载样本数据。

加载医院

若要只保留血压的第一列,请将数据存储在表中。

台=表(hospital.Sex hospital.Age、hospital.Weight hospital.Smoker, hospital.BloodPressure (: 1),......'variablenames',{“性”“年龄”“重量”“抽烟”“血压”});

执行逐步线性回归。

对于初始模型,请使用所有术语及其成对交互的完整模型。

mdl = stepwiselm(资源描述,“互动”
1.去除性别:吸烟者,FSTAT = 0.050738,PVALUE = 0.8223 2.拆卸重量:吸烟者,FSTAT = 0.07758,PVALUE = 0.78124 3.去除年龄:重量,FSTAT = 1.9717,PVALUE = 0.16367 4.去除性别:年龄,FSTAT= 0.32389,pvalue = 0.57067 5.去除年龄:吸烟者,Fstat = 2.4939,pvalue = 0.11768
MDL =线性回归模型:血压〜1 +年龄+吸烟*体重估计系数:估计估计系数PVALUE ______________________7 10.337 12.883 1.76E-22 SEX_MALE-35.269 17.524 -2.0126 0.047664 1.712 0.090198重量-0.1393 0.080211-1.7367 0.085722吸烟者_1 9.8307 1.0229 9.6102 1.2391E-15 SEX_MALE:重量0.2341 0.11192 2.0917 0.039162观测数量:100,误差自由度:94根均匀误差:4.72 R线:0.53,调整R线:0.505 F统计与常数型号:21.2,P值= 4E-14

公式形式的最终模型为血压~ 1 +年龄+吸烟者+性别*体重.该模型包括所有四种主要效果(年龄,吸烟者,性别,重量)和双向相互作用性别重量.该模型对应于

B. P. = β 0. + β 一种 X 一种 + β S. m 一世 S. m + β S. 一世 S. + β W. X W. + β S. W. X W. 一世 S. + ϵ

在哪里

  • B. P. 是血压

  • β 一世 是系数

  • 一世 S. m 为吸烟指标变量; 一世 S. m = 1 表明吸烟患者 一世 S. m = 0. 指示非吸烟患者

  • 一世 S. 是性别的指标变量; 一世 S. = 1 表示男性患者 一世 S. = 0. 表示女性患者

  • X 一种 年龄多变的

  • X W. 重量多变的

  • ϵ 为误差项

下表显示了每个性别和吸烟组合的拟合线性模型。

一世 S. m 一世 S. 线性模型 1 (吸烟者) 1 (男性) B. P. = β 0. + β S. m + β S. + β 一种 X 一种 + β W. + β S. W. X W. B. P. = 1 0. 7. 5. 6. 1 7. + 0. 1 1 5. 8. 4. X 一种 + 0. 1 1 8. 2 6. X W. 1 (吸烟者) 0. (女) B. P. = β 0. + β S. m + β 一种 X 一种 + β W. X W. B. P. = 1 4. 3. 0. 0. 0. 7. + 0. 1 1 5. 8. 4. X 一种 - 0. 1 3. 9. 3. X W. 0. (非吸烟者) 1 (男性) B. P. = β 0. + β S. + β 一种 X 一种 + β W. + β S. W. X W. B. P. = 9. 7. 9. 0. 1 + 0. 1 1 5. 8. 4. X 一种 + 0. 1 1 8. 2 6. X W. 0. (非吸烟者) 0. (女) B. P. = β 0. + β 一种 X 一种 + β W. X W. B. P. = 1 3. 3. 1 7. + 0. 1 1 5. 8. 4. X 一种 - 0. 1 3. 9. 3. X W.

从这些模型中可以看出, β S. m β S. 当指示器变量与值0相比,当指​​示灯变量取值时,显示响应函数的截距更改的程度。 β S. W. ,然而,显示了当用于性别的指标变量取值为1时,权重变量对响应变量的影响,而当权重变量取值为0时。您可以使用的方法来探索最终模型中的主要和交互效应LinearModel课程如下。

绘图预测切片图。

图plotslice(mdl)

图预测切片图包含4个轴和其他类型的uimenu, uicontrol对象。axis 1包含5个类型为line的对象。axis 2包含5个类型为line的对象。axis 3包含5个类型为line的对象。axis 4包含5个类型为line的对象。

此曲线显示所有预测器变量的主要效果。每个面板中的绿线显示当所有其他预测器变量保持恒定时,每个面板中的变化为预测变量的函数。例如,对于37.5岁的吸烟的雄性患者,随着患者的重量增加,预期的血压会增加,给予所有其他相同的。

每个面板中的红色虚线显示了预测响应值的95%置信范围。

每个面板中的水平虚线显示了对应于垂直虚线的预测变量的特定值的预测响应。您可以拖动这些行以在其他预测值值下获取预测的响应值,如下所示。

例如,当患者是女性的,响应变量的预测值是118.3497,非镜头,40.3788磅,重139.9545磅。方括号中的值[114.621,122.079],显示出估计响应的95%置信区间的下限和上限。注意,对于非墨镜的女性患者,随着重量的增加,预期血压会降低,但赋予所有其他都保持恒定。

情节主要影响。

栅格缺点(MDL)

图包含轴。轴包含6个类型的线。

这个情节展示了主要的效果。圆圈表示效果的大小,蓝线表示主效果的上下限。例如,与不吸烟的人相比,在其他条件不变的情况下,吸烟者的预期血压会升高10个单位。同样,在其他预测因素保持不变的情况下,男性的预期血压要比女性高两个单位。年龄从25岁增加到50岁,预计会增加4个单位,而体重从111岁增加到202岁,在其他因素保持不变的情况下,预计血压会降低4个单位。

情节的交互影响。

图plotInteraction (mdl,“性”“重量”

图包含轴。具有性别和重量标题相互作用的轴包含11个类型的线。

此曲线显示给出另一个因素的变化的影响,另一个因素以值固定。

在解释相互作用的影响时要谨慎。当所有因素组合的数据不足或数据高度相关时,可能很难确定改变一个因素而保持另一个因素不变的相互作用效果。在这种情况下,估计的相互作用效应是一个外推从数据。

蓝色圆圈表示特定术语的主要效果,如主效果图中所示。红色的圆圈表示一项变化对另一项固定值的影响。例如,在图的下半部分,红色的圆圈分别显示了女性和男性患者体重变化的影响。你可以看到女性的体重的增加在111到202磅的原因14-unit血压下降预期,而体重增加相同数量的男性病人原因预计5单位增加血压,又给其他因素都保持不变。

绘图预测效应。

图plotInteraction (mdl,“性”“重量”“预测”

图包含轴。具有性别和重量的标题相互作用的轴包含3个类型线的物体。这些物体代表性别,女性,男性。

这张图显示了当另一个预测变量保持不变时改变一个变量的效果。在这个例子中,最后一个图显示了反应变量,血压,作为体重的函数,当可变性别固定为男性和女性时。男性和女性的界限是交叉的,这表明体重和性别之间有很强的相互作用。你可以看到预期的血压随着男性患者体重的增加而升高,但随着女性患者体重的增加而降低。

也可以看看

|||||

相关话题