主要内容

残留分析

策划和分析残差

从拟合模型的残差被定义为响应数据之间的差异和适合的响应数据在每个预测价值。

剩余=数据- - - - - -适合

你可以显示残差曲线钳工应用点击残差图可视化部分的曲线更健康选项卡。

在数学上,具体预测的剩余价值的区别是响应值y和预测响应值ŷ

r=y- - - - - -ŷ

假设你适合数据模型是正确的,残差近似随机错误。因此,如果残差出现随机的行为,这表明该模型与数据的吻合程度。然而,如果残差显示一个系统的模式,它是一个明显迹象,说明模型与数据的吻合程度差。总是记住许多模型拟合的结果,如信心界限,将无效的模型应该非常适合数据。

图形显示残差的一级多项式适合如下所示。上面显示残差图计算数据点的垂直距离的拟合曲线。底部的情节显示残差相对于健康,即零线。

块的残差一级多项式

残差出现随机散落在零,表明模型描述数据。

图形显示残差的二次多项式适合如下所示。模型只包含二次项,不包括一个线性或常数项。

块残差为一个二次多项式

的残差系统积极的数据范围,表明该模型是适合的数据。

例子:残留分析

这个例子符合几个多项式模型生成的数据和评估这些模型如何适应数据和更精细的预测。从一个立方曲线生成的数据,有一个大范围的差距x没有数据存在的变量。

x = [1:0.1:3 9:0.1:10]”;c = (2.5 - -0.5 1.3 - -0.1);y = c (1) + (2) * x + c (3) * x。(4)* x ^ 2 + c。^ 3 +(-0.5兰特(大小(x)));

适合曲线中的数据健康应用程序使用一个三次多项式和一个五度多项式。数据,适合和残差如下所示。你可以通过点击显示残差曲线健康应用残差图可视化部分的曲线更健康选项卡。

情节三次多项式拟合和五度多项式

模型似乎符合数据,和残差似乎随机分布在零附近。因此,图形评估适合没有透露任何明显差异的两个方程。

看数值结果结果面板和比较系数的置信界限。

结果表明,立方适应系数是准确的(小范围),虽然五次拟合系数不准确。正如所料,配合的结果poly3是合理的,因为生成的数据遵循一个立方曲线。95%置信界限的拟合系数表明,它们可以精确。然而,95%的置信限poly5表明,精确地拟合系数是未知的。

拟合优度统计所示符合表窗格。默认情况下,调整r平方,RMSE统计数据显示在表中。统计数据不揭示了两个方程之间的实质性差异。选择显示或隐藏数据,右键单击列标题。

95%的异时预测新观测范围如下所示。显示曲线的预测范围健康应用,选择95%预测范围列表中可视化部分的曲线更健康选项卡。

适用情节,预测范围两个多项式适合

的预测范围poly3表明,新的观察结果可以用一个小的不确定性预测在整个数据范围。这不是理由poly5。它有更广泛的预测范围在没有数据的地方存在,显然,因为数据不包含足够的信息来估计高多项式项准确。换句话说,一个五度多项式overfits数据。

95%的预测范围使用的拟合函数poly5如下所示。正如你所看到的,在预测的不确定性函数是大型数据中心的。因此,你会得出这样的结论:必须收集更多的数据之前,你可以使用一个五度多项式做出精确的预测。

总之,您应该检查所有可用的拟合优度措施之前决定最好的适合你的目的。图形检查的配合和残差应该是你最初的方法。然而,一些符合特征显示只有通过数值结果,统计数据,预测范围。