这个例子展示了如何建立一个多元一般线性模型的估计使用mvregress
.
此数据包含在1985年的205个自动导入样本上的测量值。
这里,建立城市和公路MPG的二元响应模型(第14和15列)。
对于预测器,使用轮基(柱3),遏制重量(柱7)和燃料型(柱18)。前两个预测器是连续的,对于该示例,以居中和缩放。燃料类型是一个分类变量,两个类别(11
和20.
),因此需要一个虚拟指标变量进行回归。
负载('进口-85'y = x (:,14:15);[n、d] = (Y)大小;X1 = zscore (X (:, 3));X2 = zscore (X (:, 7));X3 = X (: 18) = = 20;Xmat = [ones(n,1) X1 X2 X3];
的变量X3
编码是否有价值1
对于燃料型20和值0
否则。
为了方便起见,这三个预测指标(轴距、整备重量和燃油类型指标)被合并到一个设计矩阵中,并增加了一个截距项。
考虑到这些预测因子,二元MPG反应的多元一般线性模型为
在哪里 .有 总回归系数。
创建一个长度
单元格数组的2 × 8 (d × k)矩阵使用mvregress
.单元阵列中的第i矩阵是
伊势亚=细胞(1,n);为i = 1:n xcell {i} = [kron([xmat(i,i :)],眼睛(d))];结束
鉴于设计矩阵的本说明书,相应的参数向量是
采用最大似然估计拟合模型。
[β,σ,E, V] = mvregress(伊势亚,Y);β
β=8×133.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663
这些系数估计表明:
预期的城市和高速公路MPG为平均轮基,遏制重量和燃料类型11是汽车33.5
和38.6
, 分别。对于燃料类型20,预期的城市和高速公路MPG都是33.5476 - 9.2284 = 24.3192
和38.5720 - 8.6663 = 29.9057
.
路沿重量增加一个标准差对城市和高速公路的预期MPG有几乎相同的影响。在其他条件相同的情况下,预期MPG下降约6.3
在城市和公路的MPG中,路沿重量每增加一个标准差。
对于轮基的每个标准偏差增加,预期城市MPG增加0.972
,而预期的高速公路MPG仅增加0.395
在其他条件相同的情况下。
回归系数的标准误差是方差-协方差矩阵对角线的平方根,V
.
se =√诊断接头(V))
se =8×10.7365 0.7599 0.3589 0.3702 0.3497 0.3608 0.7790 0.8037
您可以很容易地将回归系数重塑为原始的4 × 2矩阵。
B =重塑(β2 4)'
B =4×233.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663
在模型假设下, 应该是独立的,符合二元标准正态分布。在这个二维的情况下,您可以使用散点图来评估这个假设的有效性。
z = E /胆固醇(σ);图()图(z(: 1)、z (:, 2),“。”)标题(标准化残差的) 抓住在%覆盖标准正常轮廓z1 = linspace(-5,5);z2 = linspace(-5,5);[zx,zy] = meshgrid(z1,z2);zgrid = [重塑(zx,100 ^ 2,1),重塑(zy,100 ^ 2,1)];Zn = REPAPE(MVNPDF(ZGRID),100,100);[C,H] =轮廓(ZX,ZY,Zn);扣(C,H)
一些残差比预期的要大,但总的来说,几乎没有证据反对多元正态假设。