主要内容

帽子矩阵和杠杆

帽子矩阵

目的

帽子矩阵提供了杠杆的度量。它有助于调查一个或多个观察结果是否与它们无关X值,因此可能会过度影响回归结果。

定义

帽子矩阵也被称为投影矩阵因为它将观测向量y投射到预测向量上, y ,将“帽子”放在y上。帽子矩阵H是用数据矩阵来定义的X

HXXTX1XT

并确定拟合值或预测值

y H y X b

的对角元素Hh2,被称为杠杆和满足

0 h 1 1 n h p

在哪里p是系数的个数,和n是观察的次数(行数X)的回归模型。HatMatrix是一个n——- - - - - -n矩阵的诊断表格

如何

在得到一个拟合模型之后,mdl,使用fitlmstepwiselm,您可以:

  • 显示HatMatrix通过使用点表示法索引属性

    mdl.Diagnostics.HatMatrix
    n很大,HatMatrix在计算上可能会很昂贵。在这些情况下,您可以直接获得对角线值,使用

    mdl.Diagnostics.Leverage

利用

目的

杠杆是对特定观察结果对回归预测的影响的度量,该影响是由该观察结果在输入空间中的位置决定的。一般来说,一个点离输入空间的中心越远,它拥有的杠杆就越多。因为杠杆价值的总和是p一个观察如果其杠杆率大大超过平均杠杆率值,则可视为离群值,p/n,例如,大于2*的值p/n

定义

观察的作用价值是多少th对角线项,h2,帽子矩阵的,H,在那里

HXXTX1XT

对角线项满足

0 h 1 1 n h p

在哪里p回归模型中系数的个数,和n为观察次数。的最小值h2是1 /n对于一个常数项的模型。如果拟合模型经过原点,则在点处观察的最小杠杆值为0x= 0。

可以表示拟合值, y ,按观测值计算,y,因为

y H y X b

因此,h2表达了多少观察y有影响 y .很大的价值h2表明,这种情况离所有X值的中心很远n有更多的筹码。利用是一个n-乘1的列向量诊断表格

如何

在得到一个拟合模型之后,mdl,使用fitlmstepwiselm,您可以:

  • 显示利用向量,使用点表示法索引属性

    mdl.Diagnostics.Leverage

  • 使用下面的方法绘制您的模型所适合的值的杠杆

    plotDiagnostics (mdl)
    看到plotDiagnostics的方法LinearModel类的细节。

确定高杠杆观察值

这个例子展示了如何计算利用重视和评估高杠杆观察。加载样本数据并定义响应和自变量。

负载医院y = hospital.BloodPressure (: 1);X =双(医院(:,2:5));

拟合线性回归模型。

mdl = fitlm (X, y);

绘制杠杆值。

plotDiagnostics (mdl)

图中包含一个坐标轴。杠杆的Case order plot的标题轴包含2个line类型的对象。这些对象表示杠杆、参考线。

对于本例,建议阈值是2*5/100 = 0.1。没有迹象表明存在高杠杆。

另请参阅

|||

相关的话题