主要内容

线性回归与交互作用

构建和分析线性回归模型与交互作用和解释结果。

加载示例数据。

负载医院

只保留第一列的血压,在一个表中存储数据。

台=表(hospital.Sex hospital.Age、hospital.Weight hospital.Smoker, hospital.BloodPressure (: 1),“VariableNames”,{“性”,“年龄”,“重量”,“抽烟”,“血压”});

执行逐步线性回归。

初始模型,使用完整的模型,所有条款及其两两交互作用。

mdl = stepwiselm(资源描述,“互动”)
1。消除性:吸烟者,FStat = 0.050738, pValue = 0.8223 - 2。删除重量:抽烟,FStat = 0.07758, pValue = 0.78124 3。除去年龄:体重,FStat = 1.9717, pValue = 0.16367 - 4。消除性别:年龄、FStat = 0.32389, pValue = 0.57067 5。除去年龄:烟,FStat = 2.4939, pValue = 0.11768
mdl =线性回归模型:血压~ 1 +年龄+吸烟者+性别*重量估计系数:估计SE tStat pValue说____ __________(拦截)133.17 10.337 12.883 1.76 e-22 Sex_Male体重年龄-35.269 17.524 -2.0126 0.047015 0.11584 0.067664 1.712 0.090198 -0.1393 0.080211 -1.7367 0.085722 Smoker_1 9.8307 1.0229 9.6102 1.2391 e15汽油Sex_Male:体重0.2341 0.11192 2.0917 0.039162的观测数量:100年,错误自由度:94根均方误差:4.72平方:0.53,调整平方:0.505 f统计量与常数模型:21.2,p值= 4 e-14

最终的模型公式形式血压~ 1 +年龄+吸烟者+性别*重量。这个模型包括所有四个主要影响(年龄、吸烟、性别、体重)和之间的双向互动重量。这个模型对应于

B P = β 0 + β 一个 X 一个 + β 年代 年代 + β 年代 年代 + β W X W + β 年代 W X W 年代 + ϵ ,

在哪里

  • B P 是血压

  • β 是系数

  • 年代 是吸烟的指示符变量; 年代 = 1 表明病人而吸烟 年代 = 0 表明一个不吸烟的病人

  • 年代 是性的指示符变量; 年代 = 1 表明男性病人而 年代 = 0 显示一名女病人

  • X 一个 年龄变量

  • X W 重量变量

  • ϵ 是误差项

下面的表显示了每个性别和吸烟的拟合线性模型的组合。

年代 年代 线性 模型 1 (吸烟) 1 (男性) B P = ( β 0 + β 年代 + β 年代 ) + β 一个 X 一个 + ( β W + β 年代 W ) X W B P ˆ = 1 0 7 5 6 1 7 + 0 1 1 5 8 4 X 一个 + 0 1 1 8 2 6 X W 1 (吸烟) 0 (女) B P = ( β 0 + β 年代 ) + β 一个 X 一个 + β W X W B P ˆ = 1 4 3 0 0 0 7 + 0 1 1 5 8 4 X 一个 - - - - - - 0 1 3 9 3 X W 0 (不抽烟) 1 (男性) B P = ( β 0 + β 年代 ) + β 一个 X 一个 + ( β W + β 年代 W ) X W B P ˆ = 9 7 9 0 1 + 0 1 1 5 8 4 X 一个 + 0 1 1 8 2 6 X W 0 (不抽烟) 0 (女) B P = β 0 + β 一个 X 一个 + β W X W B P ˆ = 1 3 3 1 7 + 0 1 1 5 8 4 X 一个 - - - - - - 0 1 3 9 3 X W

从这些模型, β 年代 β 年代 显示多少拦截响应函数的变化指示符变量的值1时相比,当需要值0。 β 年代 W 然而,显示了重量变量对响应变量的影响性需要的指示符变量值1时相比,当需要值0。你可以探索的主要和交互影响最终的模型使用的方法LinearModel类,如下所示。

情节预测片的情节。

图plotSlice (mdl)

图预测片情节包含4轴uimenu类型的对象和其他对象,uicontrol。坐标轴对象1包含5线类型的对象。坐标轴对象2包含5线类型的对象。坐标轴对象3包含5线类型的对象。坐标轴对象4包含5线类型的对象。

这张图显示所有预测的主要影响变量。每个面板中的绿线显示了响应变量的变化预测变量的函数,当所有其他预测变量保持不变。例如,对于吸烟男性37.5岁的病人会血压升高随着病人的体重增加,考虑到其他相同。

冲红曲线在每个面板显示的95%可信限预测响应值。

水平虚线在每个面板显示预测响应特定值的预测变量对应于垂直的虚线。你可以拖动这些线的预测响应值在其他因素值,如图所示。

例如,响应变量的预测值为118.3497时患者是女性,不吸烟,40.3788岁,重139.9545磅。方括号中的值,[114.621,122.079],显示上下极限的95%置信区间估计的回应。注意,对于一个不吸烟的女性病人,预期的血压下降随着体重的增加,给所有其他人都保持不变。

情节主要影响。

plotEffects (mdl)

图包含一个坐标轴对象。坐标轴对象包含6行类型的对象。

这个图显示的主要影响。圆圈显示效果和蓝线显示的大小上下信心限制的重要作用。例如,作为一个烟民增加预期的血压10单位,作为一个不抽烟的人相比,所有其他保持不变。预期血压升高对男性与女性相比,两个单位,由于其他因素保持不变。年龄从25到50的增加导致4单位的预期增加,而体重的变化从111年到202年导致预期的血压下降4单元,一切保持不变。

情节的交互影响。

图plotInteraction (mdl,“性”,“重量”)

图包含一个坐标轴对象。坐标轴对象与标题性交互和重量包含11线类型的对象。

这个图显示改变一个因素的影响考虑到其他因素固定在一个值。

小心谨慎而解释的交互影响。当没有足够的数据在所有因素组合或数据高度相关,可能很难决定改变一个因素的相互影响,同时保持其他固定。在这种情况下,估计的相互影响是一个从数据的外推。

蓝色圆圈显示特定术语的主要影响,主要影响情节。红圈显示变化的影响在一项固定值的其他项。例如,在这个图的下半部分,红圈显示体重变化的影响在男性和女性患者中,分别。你可以看到女性的体重的增加在111到202磅的原因14-unit血压下降预期,而体重增加相同数量的男性病人原因预计5单位增加血压,又给其他因素都保持不变。

情节的预测效果。

图plotInteraction (mdl,“性”,“重量”,“预测”)

图包含一个坐标轴对象。坐标轴对象与标题性交互和重量包含3线类型的对象。这些对象代表性别,女性,男性。

这个图显示改变一个变量的影响其他预测变量保持不变。在这个例子中,最后一个图显示了响应变量,血压、体重的函数,当变量性是固定在男性和女性。男性和女性的线条穿越这表明体重和性别之间的强相互作用。你可以看到预期的血压升高随着男性病人的体重增加,但增加一名女病人的体重减少。

另请参阅

|||||

相关的话题