主要内容

残留分析

绘制和分析残差

来自拟合模型的残差被定义为在每个预测值的响应数据和拟合到响应数据之间的差异。

剩余数据- - - - - -适合

您可以通过选择工具栏按钮或菜单项显示曲线配件应用程序中的残差看法>残差图

在数学上,特定预测值值的残差是响应值之间的差异y以及预测的响应值ŷ

ry- - - - - -ŷ

假设你的模型符合数据是正确的,残差近似于随机误差。因此,如果残差表现为随机的,则表明该模型与数据拟合良好。然而,如果残差显示出一个系统的模式,这是一个明确的信号,表明模型对数据的拟合很差。永远记住,模型拟合的许多结果,如置信界,将是无效的,如果模型是非常不适合的数据。

下面示出了第一度多项式配合的残留物的图形显示。顶部图表明,残差计算为从数据点到拟合曲线的垂直距离。底部绘图相对于拟合显示残差,即零线。

残差在零附近随机分布,表明模型很好地描述了数据。

下面示出了二级多项式配合的残差的图形显示。该模型仅包括二次术语,并且不包括线性或恒定项。

残差在大部分数据范围内都是系统的正的,这表明该模型不适合该数据。

例子:残留分析

这个示例适用于生成数据的几个多项式模型,并评估这些模型与数据的拟合程度以及它们的预测精度。该数据是由三次曲线生成的,其范围存在较大的差距x无数存在的变量。

X = [1:0.1:3 9:0.1:10]';C = [2.5 -0.5 1.3 -0.1];Y = c(1) + c(2)*x + c(3)*x。(4) * x ^ 2 + c。^ 3 +(-0.5兰特(大小(x)));

使用立方多项式和第五层多项式将数据符合曲线配件应用中的数据。数据,适合和残差如下所示。通过选择显示曲线拟合应用程序中的残差看法>残差图

两种模型似乎都能很好地拟合数据,残差似乎在零附近随机分布。因此,拟合的图形评价并不能揭示两个方程之间的任何明显差异。

看看数值拟合的结果结果窗格,并比较系数的置信范围。

结果表明,三次拟合系数是准确已知的(边界较小),五次拟合系数是不准确已知的。如所料,拟合结果为Poly3.是合理的,因为生成的数据遵循立方曲线。拟合系数的95%置信度界定表明它们是可接受的精确性。但是,95%的信心界限Poly5.表明拟合系数并不精确。

拟合优度统计量显示在符合表.缺省情况下,表中显示调整后的R-square和RMSE统计信息。统计数据并没有显示出这两个方程之间有实质性的差别。要选择要显示或隐藏的统计信息,右键单击列标题。

新观测95%的非同时预测界限如下所示。要在曲线拟合应用程序中显示预测界限,请选择工具>预测范围>95%

的预测界限Poly3.表明新的观测结果可以在整个数据范围内以较小的不确定性进行预测。这是不可能的Poly5..它在没有数据的区域有更宽的预测边界,这显然是因为数据中包含的信息不足以准确估计高次多项式项。换句话说,一个五次多项式过拟合数据。

拟合函数的95%预测界限使用Poly5.如下所示。正如你所看到的,预测数据中心函数的不确定性很大。因此,您会得出这样的结论:在使用五次多项式进行精确预测之前,必须收集更多的数据。

最后,您应该在决定最适合您的目的之前检查所有可用的健康措施。对契约和残留物的图形检查应始终是您的初步方法。然而,只有通过数值拟合结果,统计和预测范围仅揭示了一些拟合特征。