主要内容

残差

目的

残差对于检测离群是有用的y值和检查线性回归假设关于回归模型中的误差项。高杠杆的观测值有更小的残差,因为它们经常使回归线或表面更接近它们。你也可以使用残差来检测某些形式的异方差和自相关。

定义

残差矩阵是一个n-4表,包含四种残差,每个观测值有一行。

原始残差

观测值减去拟合值,即,

r y y

皮尔森残差

原始残差除以均方根误差,即,

p r r 年代 E

在哪里r是生残和均方误差为均方误差。

标准化残差

标准化残差是原始残差除以估计标准差。用于观察的标准化残差

年代 t r 年代 E 1 h

在哪里均方误差是否均方误差和h2杠杆是否具有观察价值

Studentized残差

研究残差是原始残差除以残差标准差的独立估计。观测残差除以基于除观测外的所有观测的误差标准差的估计值

年代 r r 年代 E 1 h

在哪里均方误差回归拟合的均方误差是否通过去除观测值来计算,h2杠杆是否具有观察价值.studentized残留有一个t分布与n- - - - - -p1个自由度。

如何

在得到一个拟合模型之后,mdl,使用fitlmstepwiselm,您可以:

  • 找到残差下表mdl对象。

  • 通过使用点表示法对属性进行索引,以向量形式获取这些列中的任何一列,例如:

    mdl.Residuals.Raw

  • 使用下列方法绘制模型拟合值的任何残差

    plotResiduals (mdl)
    具体操作请参见plotResiduals的方法LinearModel类。

使用残差评估模型假设

这个例子展示了如何通过检验一个拟合的线性回归模型的残差来评估模型假设。

加载示例数据并将独立变量和响应变量存储在一个表中。

负载进口- 85台=表(X (:, 7) X (:, 8), X (:, 9), X (:, 15),“VariableNames”...“curb_weight”“engine_size”“生”“价格”});

拟合线性回归模型。

mdl = fitlm(台)
mdl =线性回归模型:price ~ 1 + curb_weight + engine_size + boreEstimate SE tStat pValue __________ _________ _______ __________ (Intercept) 64.095 3.703 17.309 2.0481e-41 curb_weight -0.0086681 0.0011025 -7.8623 2.42e-13 engine_size -0.015806 0.013255 -1.1925 0.23452 bore -2.6998 1.3489 -2.0015 0.046711观测数量:201,误差自由度:197根均方误差:3.95 r平方:0.674,调整R-Squared: 0.669 F-statistic vs. constant model: 136, p-value = 1.14e-47

绘制原始残差的直方图。

plotResiduals (mdl)

图中包含一个坐标轴。以残差直方图为标题的坐标轴包含一个patch类型的对象。

直方图显示残差稍微右偏。

绘制所有四种残差的箱线图。

Res = table2array (mdl.Residuals);箱线图(Res)

图中包含一个坐标轴。轴包含28个线型对象。

你也可以在箱形图中看到残差的右斜结构。

绘制原始残差的正态概率图。

plotResiduals (mdl“概率”

图中包含一个坐标轴。标题为残差正态概率图的坐标轴包含两个线型对象。

这个正态概率图还显示了残差分布右尾偏离正态和偏态的情况。

绘制残差与滞后残差的曲线。

plotResiduals (mdl“落后”

图中包含一个坐标轴。标题为残差与滞后残差图的坐标轴包含3个线型对象。

这张图显示了一个趋势,表明残差之间可能存在相关性。您可以使用进一步检查dwt (mdl).残差之间的序列相关通常意味着模型可以改进。

绘制残差的对称图。

plotResiduals (mdl“对称”

图中包含一个坐标轴。标题为“中值残差对称图”的轴包含2个类型为line的对象。

这幅图还表明,残差在中位数周围的分布并不均匀,这是正态分布的预期。

绘制残差与拟合值的关系。

plotResiduals (mdl“安装”

图中包含一个坐标轴。标题为残差与拟合值图的轴包含两个类型为line的对象。

方差随拟合值的增加而增加,表明可能存在异方差。

参考文献

阿特金森绘图、转换和回归。诊断回归分析的图解方法简介。纽约:牛津统计科学丛书,牛津大学出版社,1987。

Neter, J., M. H. Kutner, C. J. Nachtsheim, W. Wasserman。应用线性统计模型.《麦克劳-希尔公司》,1996。

[3] Belsley, D. A., E. Kuh和R. E. Welsch。回归诊断,识别有影响的数据和共线性的来源.《概率与数理统计的威利系列》,约翰·威利父子公司,1980。

另请参阅

|||||

相关的话题