帽子矩阵提供了杠杆的度量。它有助于调查一个或多个观察结果是否与它们无关X值,因此可能会过度影响回归结果。
帽子矩阵也被称为投影矩阵因为它将观测向量y投射到预测向量上, ,将“帽子”放在y上。帽子矩阵H是用数据矩阵来定义的X:
H=X(XTX)1XT
并确定拟合值或预测值
的对角元素H,h2,被称为杠杆和满足
在哪里p是系数的个数,和n是观察的次数(行数X)的回归模型。HatMatrix
是一个n——- - - - - -n矩阵的诊断
表格
在得到一个拟合模型之后,mdl
,使用fitlm
或stepwiselm
,您可以:
显示HatMatrix
通过使用点表示法索引属性
mdl.Diagnostics.HatMatrix
HatMatrix
在计算上可能会很昂贵。在这些情况下,您可以直接获得对角线值,使用
mdl.Diagnostics.Leverage
杠杆是对特定观察结果对回归预测的影响的度量,该影响是由该观察结果在输入空间中的位置决定的。一般来说,一个点离输入空间的中心越远,它拥有的杠杆就越多。因为杠杆价值的总和是p一个观察我如果其杠杆率大大超过平均杠杆率值,则可视为离群值,p/n,例如,大于2*的值p/n.
观察的作用我价值是多少我th对角线项,h2,帽子矩阵的,H,在那里
H=X(XTX)1XT.
在哪里p回归模型中系数的个数,和n为观察次数。的最小值h2是1 /n对于一个常数项的模型。如果拟合模型经过原点,则在点处观察的最小杠杆值为0x= 0。
可以表示拟合值, ,按观测值计算,y,因为
因此,h2表达了多少观察y我有影响
.很大的价值h2表明,我这种情况离所有X值的中心很远n有更多的筹码。利用
是一个n-乘1的列向量诊断
表格
在得到一个拟合模型之后,mdl
,使用fitlm
或stepwiselm
,您可以:
显示利用
向量,使用点表示法索引属性
mdl.Diagnostics.Leverage
使用下面的方法绘制您的模型所适合的值的杠杆
plotDiagnostics (mdl)
plotDiagnostics
的方法LinearModel
类的细节。这个例子展示了如何计算利用
重视和评估高杠杆观察。加载样本数据并定义响应和自变量。
负载医院y = hospital.BloodPressure (: 1);X =双(医院(:,2:5));
拟合线性回归模型。
mdl = fitlm (X, y);
绘制杠杆值。
plotDiagnostics (mdl)
对于本例,建议阈值是2*5/100 = 0.1。没有迹象表明存在高杠杆。
fitlm
|LinearModel
|plotDiagnostics
|stepwiselm