多元一般线性模型
这个例子展示了如何建立一个多元评估使用一般线性模型mvregress
。
加载示例数据。
这个数据包含测量205汽车进口从1985年的一个示例。
这里,模型二元响应的城市和高速公路MPG(列14和15)。
对于预测,使用轴距(第3列),控制体重(列7),和燃料类型(列18)。前两个预测是连续的,在这个例子中是集中和扩展。燃料类型是类别变量两类(11
和20.
),所以需要一个虚拟的指示符变量回归。
负载(“进口- 85”)Y = X(:,福音14:15);[n、d] = (Y)大小;X1 = zscore (X (:, 3));X2 = zscore (X (:, 7));X3 = X (: 18) = = 20;Xmat = [(n, 1) (X1, X2)的X3);
的变量X3
编码有价值吗1
燃料类型,和价值0
否则。
为了方便起见,这三个预测因子(轴距、整备质量和燃料类型指示器)组合成一个设计矩阵,添加了一个截距项。
建立设计矩阵。
考虑到这些因素,多元二元MPG响应的一般线性模型
在哪里 。有 回归系数。
创建一个长度
单元阵列的2-by-8 (d-by-K)为使用矩阵mvregress
。第i个矩阵单元阵列中
伊势亚=细胞(1,n);为i = 1: n伊势亚{我}= [kron ([Xmat(我:)],眼(d)));结束
鉴于这种规范的设计矩阵,对应的参数向量
估计回归系数。
适合使用最大似然估计模型。
[β,σ,E, V] = mvregress(伊势亚,Y);β
β=8×133.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663
这些系数估计显示:
预期的平均城市和公路MPG汽车轴距,控制体重,和燃料类型11
33.5
和38.6
,分别。燃料类型20,预期的城市和高速公路MPG33.5476 - 9.2284 = 24.3192
和38.5720 - 8.6663 = 29.9057
。增加一个标准差的整备质量几乎相同的效果预期的城市和高速公路上英里/加仑。考虑到其他因素相同的情况,预计MPG减少了
6.3
与每一个标准偏差控制体重的增加,对于城市和公路MPG。每增加一个标准偏差在轴距,英里/加仑增加预期的城市
0.972
公路英里/加仑,而预期增加0.395
,因为一切是相等的。
计算标准错误。
标准回归系数的错误variance-covariance的对角矩阵的平方根,V
。
se =√诊断接头(V))
se =8×10.7365 0.7599 0.3589 0.3702 0.3497 0.3608 0.7790 0.8037
重塑系数矩阵。
您可以很容易地重塑回归到原始的4×2的矩阵系数矩阵。
B =重塑(β2 4)'
B =4×233.5476 38.5720 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663
检查模型的假设。
在模型的假设下, 应该是独立的,二元标准正态分布。在二维情况下,您可以评估使用散点图这一假设的有效性。
z = E /胆固醇(σ);图()图(z (: 1)、z (:, 2),“。”)标题(标准化残差的)举行在%覆盖标准正常的轮廓z1 = linspace (5,5);z2 = linspace (5,5);[zx, zy] = meshgrid (z1 (z2);zgrid =[重塑(zx 100 ^ 2, 1),重塑(zy 100 ^ 2 1)];锌=重塑(mvnpdf (zgrid), 100100);[c, h] =轮廓(zx、zy、锌);clabel (c、h)
一些残差大于预期,但整体而言,几乎没有证据表明对多元常态假设。