主要内容

多元一般线性模型

这个例子展示了如何建立一个多元一般线性模型的估计使用mvregress

加载示例数据。

此数据包含在1985年的205个自动导入样本上的测量值。

这里,建立城市和公路MPG的二元响应模型(第14和15列)。

对于预测器,使用轮基(柱3),遏制重量(柱7)和燃料型(柱18)。前两个预测器是连续的,对于该示例,以居中和缩放。燃料类型是一个分类变量,两个类别(1120.),因此需要一个虚拟指标变量进行回归。

负载('进口-85'y = x (:,14:15);[n、d] = (Y)大小;X1 = zscore (X (:, 3));X2 = zscore (X (:, 7));X3 = X (: 18) = = 20;Xmat = [ones(n,1) X1 X2 X3];

的变量X3编码是否有价值1对于燃料型20和值0否则。

为了方便起见,这三个预测指标(轴距、整备重量和燃油类型指标)被合并到一个设计矩阵中,并增加了一个截距项。

建立设计矩阵。

考虑到这些预测因子,二元MPG反应的多元一般线性模型为

y 1 1 y 1 2 y 2 1 y 2 2 y n 1 y n 2 1 x 1 1 x 1 2 x 1 3. 1 x 2 1 x 2 2 x 2 3. 1 x n 1 x n 2 x n 3. β 0 1 β 0 2 β 1 1 β 1 2 β 2 1 β 2 2 β 3. 1 β 3. 2 + ε. 1 1 ε. 1 2 ε. 2 1 ε. 2 2 ε. n 1 ε. n 2

在哪里 ε. ε. 1 ε. 2 - V N 0 σ. .有 K 8 总回归系数。

创建一个长度 n 2 0 5 单元格数组的2 × 8 (d × k)矩阵使用mvregress.单元阵列中的第i矩阵是

X 1 0 x 1 0 x 2 0 x 3. 0 0 1 0 x 1 0 x 2 0 x 3.

伊势亚=细胞(1,n);i = 1:n xcell {i} = [kron([xmat(i,i :)],眼睛(d))];结束

鉴于设计矩阵的本说明书,相应的参数向量是

β β 0 1 β 0 2 β 1 1 β 1 2 β 2 1 β 2 2 β 3. 1 β 3. 2

估计回归系数。

采用最大似然估计拟合模型。

[β,σ,E, V] = mvregress(伊势亚,Y);β
β=8×133.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663

这些系数估计表明:

  • 预期的城市和高速公路MPG为平均轮基,遏制重量和燃料类型11是汽车33.538.6, 分别。对于燃料类型20,预期的城市和高速公路MPG都是33.5476 - 9.2284 = 24.319238.5720 - 8.6663 = 29.9057

  • 路沿重量增加一个标准差对城市和高速公路的预期MPG有几乎相同的影响。在其他条件相同的情况下,预期MPG下降约6.3在城市和公路的MPG中,路沿重量每增加一个标准差。

  • 对于轮基的每个标准偏差增加,预期城市MPG增加0.972,而预期的高速公路MPG仅增加0.395在其他条件相同的情况下。

计算标准错误。

回归系数的标准误差是方差-协方差矩阵对角线的平方根,V

se =√诊断接头(V))
se =8×10.7365 0.7599 0.3589 0.3702 0.3497 0.3608 0.7790 0.8037

重塑系数矩阵。

您可以很容易地将回归系数重塑为原始的4 × 2矩阵。

B =重塑(β2 4)'
B =4×233.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663

检查模型的假设。

在模型假设下, z E σ. - 1 / 2 应该是独立的,符合二元标准正态分布。在这个二维的情况下,您可以使用散点图来评估这个假设的有效性。

z = E /胆固醇(σ);图()图(z(: 1)、z (:, 2),“。”)标题(标准化残差的) 抓住%覆盖标准正常轮廓z1 = linspace(-5,5);z2 = linspace(-5,5);[zx,zy] = meshgrid(z1,z2);zgrid = [重塑(zx,100 ^ 2,1),重塑(zy,100 ^ 2,1)];Zn = REPAPE(MVNPDF(ZGRID),100,100);[C,H] =轮廓(ZX,ZY,Zn);扣(C,H)

图中包含一个轴对象。标题为标准化残差的轴对象包含两个类型为线、轮廓的对象。

一些残差比预期的要大,但总的来说,几乎没有证据反对多元正态假设。

另请参阅

|

相关的例子

更多关于