主要内容

线性回归与交互效应

用交互效应构建和分析线性回归模型,解释结果。

加载样本数据。

加载医院

为了仅保留第一列血压,将数据存储在桌子中。

TBL =桌(医院.Sex,Hospital.age,Hospital.weight,Hospital.smoker,Hospital.blocture(:1),......'variablenames',{'性别''年龄''重量'“吸烟者”'血压'});

执行逐步线性回归。

对于初始模型,请使用所有术语及其成对交互的完整模型。

mdl = stepwiselm(tbl,'互动'
1.去除性别:吸烟者,FSTAT = 0.050738,PVALUE = 0.8223 2.拆卸重量:吸烟者,FSTAT = 0.07758,PVALUE = 0.78124 3.去除年龄:重量,FSTAT = 1.9717,PVALUE = 0.16367 4.去除性别:年龄,FSTAT= 0.32389,pvalue = 0.57067 5.去除年龄:吸烟者,Fstat = 2.4939,pvalue = 0.11768
MDL =线性回归模型:血压〜1 +年龄+吸烟*体重估计系数:估计估计系数PVALUE ______________________7 10.337 12.883 1.76E-22 SEX_MALE-35.269 17.524 -2.0126 0.047664 1.712 0.090198重量-0.1393 0.080211-1.7367 0.085722吸烟者_1 9.8307 1.0229 9.6102 1.2391E-15 SEX_MALE:重量0.2341 0.11192 2.0917 0.039162观测数量:100,误差自由度:94根均匀误差:4.72 R线:0.53,调整R线:0.505 F统计与常数型号:21.2,P值= 4E-14

式形式中的最终模型是血压〜1 +年龄+吸烟+性别*重量。该模型包括所有四种主要效果(年龄,吸烟者,性别,重量)和双向相互作用性别重量。该模型对应于

B. P. = β 0. + β 一种 X 一种 + β S. m 一世 S. m + β S. 一世 S. + β W. X W. + β S. W. X W. 一世 S. + ε.

在哪里

  • B. P. 是血压

  • β 一世 是系数

  • 一世 S. m 是吸烟的指标变量; 一世 S. m = 1 表明吸烟患者 一世 S. m = 0. 表示非莫斯文患者

  • 一世 S. 是性别的指标变量; 一世 S. = 1 表示男性患者 一世 S. = 0. 表示女病人

  • X 一种 是个年龄多变的

  • X W. 是个重量多变的

  • ε. 是错误的术语

下表显示了每个性别和吸烟组合的拟合线性模型。

一世 S. m 一世 S. 线性模型 1 (吸烟者) 1 (男性) B. P. = β 0. + β S. m + β S. + β 一种 X 一种 + β W. + β S. W. X W. B. P. = 1 0. 7. 5. 6. 1 7. + 0. 1 1 5. 8. 4. X 一种 + 0. 1 1 8. 2 6. X W. 1 (吸烟者) 0. (女性) B. P. = β 0. + β S. m + β 一种 X 一种 + β W. X W. B. P. = 1 4. 3. 0. 0. 0. 7. + 0. 1 1 5. 8. 4. X 一种 - 0. 1 3. 9. 3. X W. 0. (非吸烟者) 1 (男性) B. P. = β 0. + β S. + β 一种 X 一种 + β W. + β S. W. X W. B. P. = 9. 7. 9. 0. 1 + 0. 1 1 5. 8. 4. X 一种 + 0. 1 1 8. 2 6. X W. 0. (非吸烟者) 0. (女性) B. P. = β 0. + β 一种 X 一种 + β W. X W. B. P. = 1 3. 3. 1 7. + 0. 1 1 5. 8. 4. X 一种 - 0. 1 3. 9. 3. X W.

从这些模型中看到, β S. m β S. 当指示器变量与值0相比,当指​​示灯变量取值时,显示响应函数的截距更改的程度。 β S. W. 但是,当对性别的指示量变量与值为值时,在响应变量上以何时需要值为值0时,显示重量变量对响应变量的影响。您可以使用方法探索最终模型中的主要和交互效果linearmodel.课程如下。

绘图预测切片图。

图plotslice(mdl)

图预测切片图包含4轴和UIMEnu,UIControl的其他物体。轴1包含5个类型的线。轴2包含5型对象的类型。轴3包含5个类型的型号。轴4包含5个类型的线。

此曲线显示所有预测器变量的主要效果。每个面板中的绿线显示当所有其他预测器变量保持恒定时,每个面板中的变化为预测变量的函数。例如,对于37.5岁的吸烟的雄性患者,随着患者的重量增加,预期的血压会增加,给予所有其他相同的。

每个面板中的虚线红色曲线显示了预测响应值的95%置信度界限。

每个面板中的水平虚线显示了对应于垂直虚线的预测变量的特定值的预测响应。您可以拖动这些行以在其他预测值值下获取预测的响应值,如下所示。

例如,当患者是女性的,响应变量的预测值是118.3497,非镜头,40.3788磅,重139.9545磅。方括号中的值[114.621,122.079],显示出估计响应的95%置信区间的下限和上限。注意,对于非墨镜的女性患者,随着重量的增加,预期血压会降低,但赋予所有其他都保持恒定。

绘制主要效果。

栅格缺点(MDL)

图包含轴。轴包含6个类型的线。

此绘图显示主要效果。圆圈显示效果的大小,蓝线显示出主要效果的上下置信限制。例如,作为吸烟者将预期的血压增加10个单位,而不是作为非主人,给予所有其他都保持不变。与女性相比,预期血压增加了约两个单位的男性,同样给予其他预测因子保持恒定。25至50岁的年龄的增加导致预期的4个单位增加,而重量的重量变化从111到202的变化导致预期血压的4单位减少,给予所有其他保持常数。

绘制互动效应。

图PlotInteraction(MDL,'性别''重量'

图包含轴。具有性别和重量标题相互作用的轴包含11个类型的线。

此曲线显示给出另一个因素的变化的影响,另一个因素以值固定。

在解释互动效应时要谨慎。当所有因子组合或数据都没有足够的数据时,并且数据高度相关时,可能难以确定改变一个因子的相互作用效果,同时保持另一个因素。在这种情况下,估计的相互作用效果是与数据的推断。

蓝色圆圈显示特定项的主要效果,如在主要效果图中。红色圆圈显示了一个术语的一个术语的变化的影响,以获得另一个术语的固定值。例如,在该图的下半部分,红圆圈展示了女性和男性患者的重量变化的影响。You can see that an increase in a female’s weight from 111 to 202 pounds causes about a 14-unit decrease in the expected blood pressure, while an increase of the same amount in the weight of a male patient causes about a 5-unit increase in the expected blood pressure, again given other predictors are held constant.

绘图预测效应。

图PlotInteraction(MDL,'性别''重量''预测'

图包含轴。具有性别和重量的标题相互作用的轴包含3个类型线的物体。这些物体代表性别,女性,男性。

该图显示了随着其他预测变量变为变量的效果保持恒定。在该示例中,最后一个图显示了当变性固定在男性和女性的变性时,响应变量,血压是重量的函数。男性和女性的线条是交叉,表明重量和性别之间的强烈相互作用。当雄性患者的重量增加时,你可以看到预期的血压增加,但随着女性患者的重量增加而降低。

也可以看看

|||||

相关话题