主要内容

评价拟合优度

如何评价适合度

用一个或多个模型拟合数据后,应该评估拟合的优度。在曲线拟合应用程序中显示的拟合曲线的视觉检查应该是你的第一步。除此之外,工具箱还提供了这些方法来评估线性和非线性参数拟合的优度:

在统计文献中,术语拟合优度在这里有几个含义:一个“合适的”可能是一个模型

  • 根据最小二乘拟合的假设,你的数据可以合理地来自

  • 模型系数的估计具有很小的不确定性

  • 这就解释了你的数据中很大一部分的可变性,并且能够非常确定地预测新的观测结果

特定的应用程序还可能规定模型拟合的其他方面,这些方面对实现良好的拟合很重要,例如易于解释的简单模型。这里描述的方法可以帮助你确定在所有这些意义上的契合度。

这些方法分为两类:图形法和数值法。绘制残差和预测边界是帮助直观解释的图形方法,而计算拟合优度统计和系数置信度边界则产生帮助统计推理的数值措施。

一般来说,图形度量比数值度量更有益,因为它们允许您一次查看整个数据集,并且可以轻松地显示模型和数据之间的广泛关系。数值度量更狭窄地集中于数据的特定方面,并经常试图将该信息压缩为单个数字。在实践中,根据您的数据和分析需求,您可能需要使用这两种类型来确定最合适的。

请注意,根据这些方法,可能没有一个适合您的数据。在这种情况下,您可能需要选择一个不同的模型。也有可能所有的拟合度测量都表明某一特定的拟合是合适的。然而,如果您的目标是提取具有物理意义的拟合系数,但是您的模型没有反映数据的物理性质,那么得到的系数是无用的。在这种情况下,理解你的数据代表什么以及它是如何被测量的与评估拟合的好坏同样重要。

拟合优度统计

在使用图形方法评估拟合优度之后,您应该检查拟合优度统计数据。曲线拟合工具箱™软件支持参数模型的拟合优度统计:金宝app

  • 误差平方和(SSE)

  • r平方

  • 调整r平方

  • 均方根误差(RMSE)

对于当前匹配,这些统计信息显示在结果窗格。对于当前曲线拟合会话中的所有拟合,您可以在符合表

要在命令行中获得合适的统计信息,可以:

  • 在曲线拟合app中,选择适合>保存到工作空间导出您的适合和适合的优点到工作空间。

  • 指定gof参数的输出适合函数。

误差平方和

这个统计量测量响应值从拟合到响应值的总偏差。它也称为残差的平方和,通常标记为上交所

年代 年代 E 1 n w y y 2

值越接近0,表示模型的随机误差分量越小,这种拟合对预测更有帮助。

r平方

这个统计量衡量的是,在解释数据变化时,拟合的成功程度。换句话说,R-square是响应值与预测响应值之间相关性的平方。又称多重相关系数的平方和多重判定系数。

r平方定义为回归的平方和(苏维埃社会主义共和国)和总平方和(风场).苏维埃社会主义共和国被定义为

年代 年代 R 1 n w y y ¯ 2

风场也称为均值的平方和,定义为

年代 年代 T 1 n w y y ¯ 2

在哪里风场苏维埃社会主义共和国+上交所.给定这些定义,r平方表示为

r平方 年代 年代 R 年代 年代 T 1 年代 年代 E 年代 年代 T

R-square可以取0到1之间的任何值,接近1的值表明模型解释了更大比例的方差。例如,R-square值为0.8234意味着拟合解释了关于平均值的数据总变异的82.34%。

如果增加模型中拟合系数的数量,R-square将增加,尽管实际意义上的拟合可能不会改善。为了避免这种情况,您应该使用下面描述的自由度调整R-square统计量。

注意,对于不包含常数项的方程,有可能得到负的r平方。因为r平方被定义为由拟合解释的方差的比例,如果拟合实际上比仅仅拟合一条水平线差,那么r平方是负的。在这种情况下,r平方不能被解释为相关的平方。这种情况表明应该向模型中添加一个常数项。

自由度调整r平方

该统计量使用上面定义的r平方统计量,并根据剩余自由度对其进行调整。剩余自由度定义为响应值的个数n减去拟合系数的数目根据响应值估计。

vn- - - - - -

v关联的独立信息块的数量n计算平方和所需的数据点。注意,如果参数是有界的,并且一个或多个估计在它们的边界上,那么这些估计被认为是固定的。自由度随这些参数的数目而增加。

当你比较两个模型时,调整后的r平方统计量通常是最佳的拟合质量指标嵌套的-即一系列模型,每个模型都在前一个模型的基础上增加了额外的系数。

调整r平方 1 年代 年代 E n 1 年代 年代 T v

调整后的r平方统计量可以接受任何小于或等于1的值,接近1的值表示更好的拟合。当模型包含不能帮助预测响应的项时,可能会出现负值。

均方根误差

这个统计量也称为拟合标准误差和回归标准误差。它是对数据中随机分量的标准差的估计,定义为

R 年代 E 年代 年代 E

在哪里均方误差是均方误差还是残差均方

年代 E 年代 年代 E v

就像上交所,一个均方误差值越接近0,表示对预测更有用。

另请参阅

相关的话题