多元通用线性模型
这个例子展示了如何建立多元一般线性模型进行估计mvregress
.
加载示例数据。
该数据包含了1985年以来205辆进口汽车的样本数据。
在这里,对城市和公路MPG的双变量响应进行建模(第14和15列)。
对于预测器,使用轴距(第3栏)、整备重量(第7栏)和燃料类型(第18栏)。前两个预测器是连续的,对于本例来说是居中和缩放的。Fuel type是一个有两个类别的分类变量(11
和20.
),因此需要一个虚拟指标变量进行回归分析。
负载(“进口- 85”) y = x (:,14:15);[n、d] = (Y)大小;X1 = zscore (X (:, 3));X2 = zscore (X (:, 7));X3 = X (: 18) = = 20;Xmat = [ones(n,1) X1 X2 X3];
的变量X3
编码有值吗1
对于燃料类型20和值0
否则。
为了方便起见,这三个预测器(轴距、整备重量和燃油类型指示器)被组合成一个设计矩阵,并添加了一个拦截项。
建立设计矩阵。
有了这些预测因子,双变量MPG反应的多变量一般线性模型是
在哪里 .有 总的回归系数。
创建一个长度
单元数组2 × 8 (d × k)矩阵使用mvregress
.单元数组中的第i个矩阵为
伊势亚=细胞(1,n);为i = 1:n Xcell{i} = [kron([Xmat(i,:)],眼睛(d))];结束
给定设计矩阵的这种规范,相应的参数向量为
估计回归系数。
利用极大似然估计拟合模型。
[β,σ,E, V] = mvregress(伊势亚,Y);β
β=8×133.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663
这些系数估计表明:
平均轴距、整备重量和燃油类型为11的汽车的城市和高速公路的预期MPG是
33.5
和38.6
,分别。对于20型燃料,预期的城市和高速公路MPG是33.5476 - 9.2284 = 24.3192
和38.5720 - 8.6663 = 29.9057
.每增加一个标准偏差,对城市和高速公路的预期MPG的影响几乎相同。在其他条件相同的情况下,预期的MPG减少了大约
6.3
每增加一个标准偏差,在整备重量,无论是城市和公路的MPG。轴距每增加一个标准偏差,预期的城市MPG就会增加
0.972
而预期的高速公路MPG只增加了一点0.395
在其他条件相同的情况下。
计算标准错误。
回归系数的标准误差是方差-协方差矩阵对角线的平方根,V
.
se =√诊断接头(V))
se =8×10.7365 0.7599 0.3589 0.3702 0.3497 0.3608 0.7790 0.8037
重塑系数矩阵。
您可以很容易地将回归系数重新塑造为原始的4 × 2矩阵。
B =重塑(β2 4)'
B =4×233.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663
检查模型的假设。
在模型假设下, 应该是独立的,二元标准正态分布。在这个二维情况下,您可以使用散点图来评估这个假设的有效性。
z = E /胆固醇(σ);图()图(z(: 1)、z (:, 2),“。”)标题(标准化残差的)举行在%覆盖标准法线轮廓z1 = linspace (5,5);z2 = linspace (5,5);[zx, zy] = meshgrid (z1 (z2);zgrid =[重塑(zx 100 ^ 2, 1),重塑(zy 100 ^ 2 1)];锌=重塑(mvnpdf (zgrid), 100100);[c, h] =轮廓(zx、zy、锌);clabel (c、h)
有几个残差比预期的要大,但总的来说,几乎没有证据反对多元正态假设。