多元一般线性模型

打开直播脚本

这个例子展示了如何建立一个多元一般线性模型的估计使用mvregress．

加载示例数据。

此数据包含在1985年的205个自动导入样本上的测量值。

这里，建立城市和公路MPG的二元响应模型(第14和15列)。

对于预测器，使用轮基（柱3），遏制重量（柱7）和燃料型（柱18）。前两个预测器是连续的，对于该示例，以居中和缩放。燃料类型是一个分类变量，两个类别（11和20.)，因此需要一个虚拟指标变量进行回归。

负载('进口-85'y = x (:，14:15);[n、d] = (Y)大小;X1 = zscore (X (:, 3));X2 = zscore (X (:, 7));X3 = X (: 18) = = 20;Xmat = [ones(n,1) X1 X2 X3];

的变量X3编码是否有价值1对于燃料型20和值0否则。

为了方便起见，这三个预测指标(轴距、整备重量和燃油类型指标)被合并到一个设计矩阵中，并增加了一个截距项。

建立设计矩阵。

考虑到这些预测因子，二元MPG反应的多元一般线性模型为

$［ \begin{array}{cc} y_{11} & y_{12} \\ y_{21} & y_{22} \\ ⋮ & ⋮ \\ y_{n 1} & y_{n 2} \end{array} ］＝［ \begin{array}{cccc} 1 & x_{11} & x_{12} & x_{1 3.} \\ 1 & x_{21} & x_{22} & x_{2 3.} \\ ⋮ & ⋮ & ⋮ & ⋮ \\ 1 & x_{n 1} & x_{n 2} & x_{n 3.} \end{array} ］［ \begin{array}{cc} β_{01} & β_{02} \\ β_{11} & β_{12} \\ β_{21} & β_{22} \\ β_{3. 1} & β_{3. 2} \end{array} ］ + ［ \begin{array}{cc} {ε.}_{11} & {ε.}_{12} \\ {ε.}_{21} & {ε.}_{22} \\ ⋮ & ⋮ \\ {ε.}_{n 1} & {ε.}_{n 2} \end{array} ］，$

在哪里 ${ε.}_{我} ＝ {（ {ε.}_{我 1} ， {ε.}_{我 2} ）}^{”} - 米 V N （ 0 ， σ. ）$ ．有 $K ＝ 8$ 总回归系数。

创建一个长度 $n ＝ 205$ 单元格数组的2 × 8 (d × k)矩阵使用mvregress．单元阵列中的第i矩阵是

$X （我）＝［ \begin{array}{cccccccc} 1 & 0 & x_{我 1} & 0 & x_{我 2} & 0 & x_{我 3.} & 0 \\ 0 & 1 & 0 & x_{我 1} & 0 & x_{我 2} & 0 & x_{我 3.} \end{array} ］．$

伊势亚=细胞(1,n);为i = 1：n xcell {i} = [kron（[xmat（i，i :)]，眼睛（d））];结束

鉴于设计矩阵的本说明书，相应的参数向量是

$β ＝［ \begin{array}{c} β_{01} \\ β_{02} \\ β_{11} \\ β_{12} \\ β_{21} \\ β_{22} \\ β_{3. 1} \\ β_{3. 2} \end{array} ］．$

估计回归系数。

采用最大似然估计拟合模型。

[β,σ,E, V] = mvregress(伊势亚,Y);β

β=8×133.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663

这些系数估计表明:

预期的城市和高速公路MPG为平均轮基，遏制重量和燃料类型11是汽车33.5和38.6，分别。对于燃料类型20，预期的城市和高速公路MPG都是33.5476 - 9.2284 = 24.3192和38.5720 - 8.6663 = 29.9057．
路沿重量增加一个标准差对城市和高速公路的预期MPG有几乎相同的影响。在其他条件相同的情况下，预期MPG下降约6．3在城市和公路的MPG中，路沿重量每增加一个标准差。
对于轮基的每个标准偏差增加，预期城市MPG增加0.972，而预期的高速公路MPG仅增加0.395在其他条件相同的情况下。

计算标准错误。

回归系数的标准误差是方差-协方差矩阵对角线的平方根，V．

se =√诊断接头(V))

se =8×10.7365 0.7599 0.3589 0.3702 0.3497 0.3608 0.7790 0.8037

重塑系数矩阵。

您可以很容易地将回归系数重塑为原始的4 × 2矩阵。

B =重塑(β2 4)'

B =4×233.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663

检查模型的假设。

在模型假设下， $z ＝ E {σ.}^{- 1 / 2}$ 应该是独立的，符合二元标准正态分布。在这个二维的情况下，您可以使用散点图来评估这个假设的有效性。

z = E /胆固醇(σ);图()图(z(: 1)、z (:, 2),“。”)标题(标准化残差的） 抓住在％覆盖标准正常轮廓z1 = linspace（-5,5）;z2 = linspace（-5,5）;[zx，zy] = meshgrid（z1，z2）;zgrid = [重塑（zx，100 ^ 2,1），重塑（zy，100 ^ 2,1）];Zn = REPAPE（MVNPDF（ZGRID），100,100）;[C，H] =轮廓（ZX，ZY，Zn）;扣（C，H）

图中包含一个轴对象。标题为标准化残差的轴对象包含两个类型为线、轮廓的对象。