多元通用线性模型

打开生活的脚本

这个例子展示了如何建立多元一般线性模型进行估计mvregress．

加载示例数据。

该数据包含了1985年以来205辆进口汽车的样本数据。

在这里，对城市和公路MPG的双变量响应进行建模(第14和15列)。

对于预测器，使用轴距(第3栏)、整备重量(第7栏)和燃料类型(第18栏)。前两个预测器是连续的，对于本例来说是居中和缩放的。Fuel type是一个有两个类别的分类变量(11和20.)，因此需要一个虚拟指标变量进行回归分析。

负载(“进口- 85”) y = x (:，14:15);[n、d] = (Y)大小;X1 = zscore (X (:, 3));X2 = zscore (X (:, 7));X3 = X (: 18) = = 20;Xmat = [ones(n,1) X1 X2 X3];

的变量X3编码有值吗1对于燃料类型20和值0否则。

为了方便起见，这三个预测器(轴距、整备重量和燃油类型指示器)被组合成一个设计矩阵，并添加了一个拦截项。

建立设计矩阵。

有了这些预测因子，双变量MPG反应的多变量一般线性模型是

$［ \begin{array}{cc} y_{11} & y_{12} \\ y_{21} & y_{22} \\ ⋮ & ⋮ \\ y_{n 1} & y_{n 2} \end{array} ］＝［ \begin{array}{cccc} 1 & x_{11} & x_{12} & x_{1 3.} \\ 1 & x_{21} & x_{22} & x_{2 3.} \\ ⋮ & ⋮ & ⋮ & ⋮ \\ 1 & x_{n 1} & x_{n 2} & x_{n 3.} \end{array} ］［ \begin{array}{cc} β_{01} & β_{02} \\ β_{11} & β_{12} \\ β_{21} & β_{22} \\ β_{3. 1} & β_{3. 2} \end{array} ］ + ［ \begin{array}{cc} ϵ_{11} & ϵ_{12} \\ ϵ_{21} & ϵ_{22} \\ ⋮ & ⋮ \\ ϵ_{n 1} & ϵ_{n 2} \end{array} ］，$

在哪里 $ϵ_{我} ＝ {（ ϵ_{我 1} ， ϵ_{我 2} ）}^{”} - 米 V N （ 0 ， Σ ）$ ．有 $K ＝ 8$ 总的回归系数。

创建一个长度 $n ＝ 205$ 单元数组2 × 8 (d × k)矩阵使用mvregress．单元数组中的第i个矩阵为

$X （我）＝［ \begin{array}{cccccccc} 1 & 0 & x_{我 1} & 0 & x_{我 2} & 0 & x_{我 3.} & 0 \\ 0 & 1 & 0 & x_{我 1} & 0 & x_{我 2} & 0 & x_{我 3.} \end{array} ］．$

伊势亚=细胞(1,n);为i = 1:n Xcell{i} = [kron([Xmat(i，:)]，眼睛(d))];结束

给定设计矩阵的这种规范，相应的参数向量为

$β ＝［ \begin{array}{c} β_{01} \\ β_{02} \\ β_{11} \\ β_{12} \\ β_{21} \\ β_{22} \\ β_{3. 1} \\ β_{3. 2} \end{array} ］．$

估计回归系数。

利用极大似然估计拟合模型。

[β,σ,E, V] = mvregress(伊势亚,Y);β

β=8×133.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663

这些系数估计表明:

平均轴距、整备重量和燃油类型为11的汽车的城市和高速公路的预期MPG是33.5和38.6,分别。对于20型燃料，预期的城市和高速公路MPG是33.5476 - 9.2284 = 24.3192和38.5720 - 8.6663 = 29.9057．
每增加一个标准偏差，对城市和高速公路的预期MPG的影响几乎相同。在其他条件相同的情况下，预期的MPG减少了大约6.3每增加一个标准偏差，在整备重量，无论是城市和公路的MPG。
轴距每增加一个标准偏差，预期的城市MPG就会增加0.972而预期的高速公路MPG只增加了一点0.395在其他条件相同的情况下。

计算标准错误。

回归系数的标准误差是方差-协方差矩阵对角线的平方根，V．

se =√诊断接头(V))

se =8×10.7365 0.7599 0.3589 0.3702 0.3497 0.3608 0.7790 0.8037

重塑系数矩阵。

您可以很容易地将回归系数重新塑造为原始的4 × 2矩阵。

B =重塑(β2 4)'

B =4×233.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663

检查模型的假设。

在模型假设下， $z ＝ E Σ^{- 1 / 2}$ 应该是独立的，二元标准正态分布。在这个二维情况下，您可以使用散点图来评估这个假设的有效性。

z = E /胆固醇(σ);图()图(z(: 1)、z (:, 2),“。”)标题(标准化残差的)举行在%覆盖标准法线轮廓z1 = linspace (5,5);z2 = linspace (5,5);[zx, zy] = meshgrid (z1 (z2);zgrid =[重塑(zx 100 ^ 2, 1),重塑(zy 100 ^ 2 1)];锌=重塑(mvnpdf (zgrid), 100100);[c, h] =轮廓(zx、zy、锌);clabel (c、h)

Figure包含一个轴对象。标题为标准化残差的轴对象包含2个类型为线、轮廓的对象。