残差对于检测离群是有用的y值和检查线性回归假设关于回归模型中的误差项。高杠杆的观测值有更小的残差,因为它们经常使回归线或表面更接近它们。你也可以使用残差来检测某些形式的异方差和自相关。
的残差
矩阵是一个n-4表,包含四种残差,每个观测值有一行。
观测值减去拟合值,即,
原始残差除以均方根误差,即,
在哪里r我是生残和均方误差为均方误差。
标准化残差是原始残差除以估计标准差。用于观察的标准化残差我是
在哪里均方误差是否均方误差和h2杠杆是否具有观察价值我.
研究残差是原始残差除以残差标准差的独立估计。观测残差我除以基于除观测外的所有观测的误差标准差的估计值我.
在哪里均方误差(我)回归拟合的均方误差是否通过去除观测值来计算我,h2杠杆是否具有观察价值我.studentized残留老我有一个t分布与n- - - - - -p1个自由度。
在得到一个拟合模型之后,mdl
,使用fitlm
或stepwiselm
,您可以:
找到残差
下表mdl
对象。
通过使用点表示法对属性进行索引,以向量形式获取这些列中的任何一列,例如:
mdl.Residuals.Raw
使用下列方法绘制模型拟合值的任何残差
plotResiduals (mdl)
plotResiduals
的方法LinearModel
类。这个例子展示了如何通过检验一个拟合的线性回归模型的残差来评估模型假设。
加载示例数据并将独立变量和响应变量存储在一个表中。
负载进口- 85台=表(X (:, 7) X (:, 8), X (:, 9), X (:, 15),“VariableNames”,...{“curb_weight”,“engine_size”,“生”,“价格”});
拟合线性回归模型。
mdl = fitlm(台)
mdl =线性回归模型:price ~ 1 + curb_weight + engine_size + boreEstimate SE tStat pValue __________ _________ _______ __________ (Intercept) 64.095 3.703 17.309 2.0481e-41 curb_weight -0.0086681 0.0011025 -7.8623 2.42e-13 engine_size -0.015806 0.013255 -1.1925 0.23452 bore -2.6998 1.3489 -2.0015 0.046711观测数量:201,误差自由度:197根均方误差:3.95 r平方:0.674,调整R-Squared: 0.669 F-statistic vs. constant model: 136, p-value = 1.14e-47
绘制原始残差的直方图。
plotResiduals (mdl)
直方图显示残差稍微右偏。
绘制所有四种残差的箱线图。
Res = table2array (mdl.Residuals);箱线图(Res)
你也可以在箱形图中看到残差的右斜结构。
绘制原始残差的正态概率图。
plotResiduals (mdl“概率”)
这个正态概率图还显示了残差分布右尾偏离正态和偏态的情况。
绘制残差与滞后残差的曲线。
plotResiduals (mdl“落后”)
这张图显示了一个趋势,表明残差之间可能存在相关性。您可以使用进一步检查dwt (mdl)
.残差之间的序列相关通常意味着模型可以改进。
绘制残差的对称图。
plotResiduals (mdl“对称”)
这幅图还表明,残差在中位数周围的分布并不均匀,这是正态分布的预期。
绘制残差与拟合值的关系。
plotResiduals (mdl“安装”)
方差随拟合值的增加而增加,表明可能存在异方差。
阿特金森绘图、转换和回归。诊断回归分析的图解方法简介。纽约:牛津统计科学丛书,牛津大学出版社,1987。
Neter, J., M. H. Kutner, C. J. Nachtsheim, W. Wasserman。应用线性统计模型.《麦克劳-希尔公司》,1996。
[3] Belsley, D. A., E. Kuh和R. E. Welsch。回归诊断,识别有影响的数据和共线性的来源.《概率与数理统计的威利系列》,约翰·威利父子公司,1980。
dwt
|fitlm
|LinearModel
|plotDiagnostics
|plotResiduals
|stepwiselm