残留分析

绘制和分析残差

从拟合模型的残差被定义为在每个预测值的响应数据和拟合之间的差异来响应数据。

剩余的=数据-适合

通过选择工具栏按钮或菜单项,您可以在曲线拟合应用程序中显示残差视图>残差情节

在数学上,残留的特定预测值是响应值之间的差ÿ与预测的响应值ŷ

[R=ÿ-ŷ

假设你适合的数据模型是正确的,残差近似于随机误差。因此,如果出现残差的行为随机,它表明该模型拟合数据良好。但是,如果残差显示系统的模式,这是一个明显的迹象表明该模型拟合不佳的数据。永远记住,模型拟合的许多成果,如置信区间,将是无效的应模型是数据非常不恰当的。

下面显示了一次多项式拟合的残差的图形。上面的图显示残差是根据从数据点到拟合曲线的垂直距离计算出来的。底部的图显示了与fit相关的残差,即零线。

残差随机出现的散落在零表明该模型描述了数据良好。

下图显示了二次多项式拟合的残差。该模型只包括二次项,不包括线性项和常数项。

残差是为许多数据的范围表明该模型是一个差适合数据系统正。

例如:应力分析

这个例子适合几个多项式模型生成的数据且评估这些模型的匹配程度的数据以及如何准确地预测。的数据是从三次曲线产生,并且在的范围内的大的间隙X变量,其中不存在任何数据。

X = [1:0.1:3 9:0.1:10]';C = [2.5 -0.5 1.3 -0.1];。Y = C(1)+ C(2)* X + C(3)* X ^ 2 + C(4)* X ^ 3 +(兰特(大小(X)) -  0.5)。

使用三次多项式和五次多项式在曲线拟合app中拟合数据。数据、适合度和残差如下所示。通过选择在曲线拟合app中显示残差视图>残差情节

这两种型号出现拟合数据良好,残差出现零附近随机分布。因此,拟合的图形评估不露两个方程之间的任何明显的差异。

看看在数值拟合结果结果窗格和比较置信区间的系数。

结果表明,在三次拟合系数被精确地知道(边界是小的),而五次拟合系数不准确已知的。正如预期的那样,对于拟合结果POLY3是合理的,因为生成的数据遵循一个三次曲线。拟合系数的95%置信范围表明它们是可接受的精确的。然而,95%置信区间是poly5表明拟合系数不确知。

优度拟合的统计数据显示在FITS的表。默认情况下,调整后的R平方和RMSE统计数据显示在表格中。统计数据不露两个方程之间的实质性区别。要选择统计显示或隐藏,请右键单击列标题。

对于新的观察的95%非同时预测范围如下所示。在曲线拟合程序显示预测范围,选择工具>预测范围>95%

对于预测范围POLY3表明该新的观察可以在整个数据范围内的小的不确定性来预测。这不是为案例poly5。它在区域宽预测边界其中不存在任何数据,这显然是由于数据不包含足够的信息来准确地估计更高程度的多项式项。换句话说,第五次多项式overfits的数据。

95%的预测使用用于拟合函数界定poly5显示在下面。正如你所看到的,在预测功能的不确定性是在数据中心的大。因此,可以得出结论,更多的数据必须收集之前,您可以用五阶多项式精确的预测。

总之,在决定最适合您的适合度之前,您应该检查所有可用的适合度度量。初始方法应该始终是对适合度和残差进行图形化检查。然而,只有通过数值拟合结果、统计量和预测界才能揭示一些拟合特征。