曲线拟合应用程序中的比较拟合

互动曲线拟合工作流程

接下来的主题将使用六次多项式方程和单项指数方程拟合一些人口普查数据。这些步骤演示了如何:

  • 使用不同的模型库加载数据,并探索各种适合。

  • 搜索最适合的:

    • 比较图形拟合结果

    • 比较数值拟合结果,包括拟合系数和拟合优度统计

  • 导出您的最佳拟合结果到MATLAB®工作区来分析在命令行模型。

  • 保存会话,并为所有的拟合和绘图MATLAB代码。

加载数据并创建配合

在使用曲线拟合应用程序拟合数据之前,必须将数据变量加载到MATLAB工作区中。对于本例,数据存储在MATLAB文件中census.mat

  1. 加载数据:

    负荷普查

    工作区包含两个新变量:

    • 日期是包含年1990至90年,10年为增量的列向量。

    • 流行是与对应于年在美国人口数字的列向量日期

  2. 打开曲线拟合应用程序:

    cftool公司

  3. 选择变量名日期流行X数据Y数据名单。

    曲线拟合的应用创建和绘图的默认拟合X输入(或预测的数据)和Y输出(或响应数据)。默认配合是线性多项式拟合类型。观察配合设置显示器多项式学位1

  4. 配合更改为通过选择二次多项式2学位名单。

    曲线拟合的应用程序绘制新飞度。曲线拟合程序计算,当您更改健身设置,因为新飞度自动调整默认情况下选择。如果改装费时,例如,对于大型数据集,您可以关闭自动调整通过清除该复选框。

    人口普查数据与一个二次多项式拟合的曲线拟合的应用所显示的结果结果窗格中,在这里你可以查看库模型,拟合系数,拟合优度拟合统计。

  5. 更改配合名称POLY2

  6. 显示由选择的残差查看>残差情节

    残差表明,一个更适合是可能的。因此,继续探索各种配合普查数据集。

  7. 添加新的拟合尝试其他图书馆方程。

    1. 在中的配合上单击鼠标右键FITS的表并选择复制“POLY2(或使用适合菜单)。

      小费

      对于给定类型的拟合(例如,多项式),使用复制“fitname而不是一个新的契合,因为复制一个适合需要更少的步骤。复制的契合包含相同的数据选择和合适的设置。

    2. 改变多项式学位3并重新命名配合POLY3

    3. 当你适应更高的多项式,则结果窗格显示这样的警告:

      公式受到严重制约。删除重复的数据点,或尝试中心和缩放。

      通过选择标准化数据中心和规模复选框。

    4. 重复步骤a和b,将多项式拟合添加到六次方,然后添加指数拟合。

    5. 对于每个新的适合,看看结果窗格中的信息,并在曲线拟合应用残差图。

      从一个不错的选择残差应该看起来是随机的,没有明显的模式。一种图案,如连续残留物的倾向,具有相同的符号,可以是一个更好的模型中存在的指示。

关于缩放

关于缩放警告的产生是因为装修过程使用日期值作为具有非常大的价值矩阵的基础。的传播日期值的结垢问题的结果。为了解决这个问题,你可以将正常化日期数据。规范化缩放预测数据以提高后续数值计算的精度。一种正常化的方法日期是在零平均值到中心,并将其扩展到单元标准偏差。等效代码为:

(CDATE  - 均值(CDATE))./ STD(CDATE)

注意

由于标准化后预测数据会发生变化,所以拟合系数的值与原始数据相比也会发生变化。然而,数据的函数形式和由此产生的拟合优度统计数据并没有改变。此外,数据将使用原始比例显示在曲线拟合应用程序绘图中。

确定最佳匹配

为了确定最合适的,你应该检查这两个图形和数字拟合结果。

检查图形拟合结果

  1. 通过检查配合和残差的图表确定最合适的。要查看各装配反过来地块,在适合的表双击配合。图形拟合结果表明:

    • 为多项式方程的拟合和残留物都是相似的,因此很难选择最好的一个。

    • 为单项指数方程拟合和残留物表明它是一个不合身的整体。因此,这是一个糟糕的选择,你可以从候选人最适合去除指数拟合。

  2. 检查拟合的行为直到2050年拟合普查数据的目的是来推断预测未来人口值的最佳选择。

    1. 在适合的表双击第六次多项式拟合,以查看该地块为这个契合。

    2. 改变通过选择曲线的轴线限工具>轴限制

    3. 改变X(CDATE)最大2050年,并增加主要Y(POP)最大400个,按进入

    4. 检查拟合曲线。第六度多项式拟合超出数据范围的行为,使其成为外插一个糟糕的选择,你可以拒绝此契合。

评估数值拟合结果

当你不再能消除图形检查他们的配合,你应该检查数值拟合结果。曲线拟合的应用所显示两种类型的数值拟合结果:

  • 优度拟合统计

  • 在拟合系数的置信区间

拟合优度,统计帮助您确定曲线吻合程度的数据。对系数的置信区间确定其准确性。

检查数值拟合结果:

  1. 对于每一个配合,查看在该拟合优度拟合统计结果窗格。

  2. 同时对比所有装配在FITS的表. 单击列标题以按统计结果排序。

  3. 检查误差平方和(SSE)和调整后的[R- 方统计数据,以帮助确定最合适的。所述SSE统计是拟合的最小二乘误差,用一个值更接近零指示的更好配合。调整后的[R-当向模型中添加其他系数时,平方统计通常是拟合质量的最佳指标。

    最大上证所EXP1表示它不合适,您已经通过检查合适度和残差确定了它。最低的SSE值与poly6。不过,这契合超出数据范围的行为,使其成为外插一个糟糕的选择,所以你已经通过检查与新中轴线的限制地块拒绝了这一契合。

    次优SSE值与五次多项式拟合相关,poly5,这表明它可能是最合适的。然而,上交所和调整[R对于剩余的多项式拟合 - 方值都非常接近对方。你应该选择哪一个?

  4. 通过检查“结果”窗格中剩余拟合的置信范围来解决最佳拟合问题。在中双击配合FITS的表到打开(或焦点如果已经打开)的拟合系数和查看结果窗格。一个适合身材显示单个合适的配合设置,结果窗格和绘图。

    显示五次多项式和POLY2配合附图并排。通过边检查结果侧可以帮助您评估适合。

    1. 以同时显示两个配合附图中,使用的布局控件在曲线的右上方件应用或选择窗口>左/右瓷砖要么顶部/底部平铺

    2. 若要更改显示的配合,请单击以选择配合图,然后双击要显示在FITS的表

    3. 比较系数和界限(P1P2,因此,在两者拟合结果窗格上)poly5POLY2. 工具箱计算系数的95%置信限。系数的置信限决定了它们的精度。检查结果窗格中的公式(F(X)= P1 * X + P2 * X...)以查看每个系数模型项。注意P2指的是p2*x型术语POLY2P2 * X ^ 4术语聚5。不要标准化系数直接与非规范化的系数进行比较。

      小费

      使用查看菜单以隐藏健身设置要么FITS的表如果你想查看更多的空间和比较的情节和结果,如下图所示。您也可以隐藏结果窗格中只显示图。

      该边界在十字架上的零P1P2P3系数为五阶多项式。这意味着你不能确保这些系数从零有所不同。如果高阶模型项可有系数为零,它们不与配合,这表明该模型overfits普查数据帮助。

      但是,小的置信区间不交叉零上P1P2P3对于二次拟合,POLY2表明拟合系数是相当准确的。

      因此,研究这两个图形和数字拟合结果后,你应该选择POLY2作为最适合来推断普查数据。

注意

与常数项、线性项和二次项相关联的拟合系数对于每个规范化多项式方程几乎相同。然而,随着多项式次数的增加,与高次项相关联的系数界过零,这表明过度拟合。

分析您的最佳匹配的工作区

您可以使用保存到工作区导出选定的配合和相关的拟合结果到MATLAB的工作空间。配合被保存为一个MATLAB对象和相关联的拟合结果保存为结构。

  1. 右键单击POLY2适合在FITS的表并选择保存“POLY2”到工作区(或使用适合菜单)。

  2. 请点击以默认名称保存。

    fittedmodel保存为曲线拟合工具箱™cfit公司宾语。

    >>卫生组织fittedmodel名字大小字节级fittedmodel 1x1的822 CFIT

检查fittedmodelcfit公司对象以显示模型,拟合系数,以及用于拟合系数的置信区间:

fittedmodel fittedmodel=线性模型Poly2:fittedmodel(x)=p1*x^2+p2*x+p3系数(95%置信限):p1=0.006541(0.006124,0.006958)p2=-23.51(-25.09,-21.93)p3=2.113e+004(1.964e+004,2.262e+004)

检查善良显示拟合优度结果的结构:

善善= SSE:159.0293 rsquare:0.9987 DFE:18 adjrsquare:0.9986 RMSE:2.9724

检查输出结构,以显示与所述配合,诸如残差相关联的附加信息:

输出输出= numobs:21 numparam:3个残差:[21X1双]雅可比:[21x3双] exitflag:1算法: 'QR分解和解决' 次迭代:1

您可以评估(插或外推),分化,或通过指定的数据范围内集成了一个适合各种后处理功能。

例如,要评估fittedmodel在值的向量来推断到2050年,输入:

Y = fittedmodel(2000:10:2050)Y = 274.6221 301.8240 330.3341 360.1524 391.2790 423.7137
绘制与人口普查数据和外推拟合值的拟合图:
图(fittedmodel,CDATE,POP)在地块保持(fittedmodel,2000:10:2050年,Y)推迟
有关交互式和命令行拟合分析的更多示例和说明,以及所有后处理函数的列表,请参见拟合后处理

有关使用命令行复制此交互式人口普查数据分析的示例,请参见多项式拟合

保存您的工作

工具箱提供了几个保存工作的选项。您可以将一个或多个配合和关联的配合结果作为变量保存到MATLAB工作区。然后,您可以将此保存的信息用于文档编制,或扩展数据浏览和分析。除了将您的工作保存到MATLAB工作空间变量之外,您还可以:

  • 通过选择保存当前曲线拟合会话文件>保存会话. 会话文件包含会话中的所有拟合和变量,并记住您的布局。见保存并刷新会议

  • 生成MATLAB代码,通过选择重新会话中的所有拟合和情节文件>生成代码。曲线拟合的应用程序在您的会话,并显示在MATLAB编辑器中的文件生成代码。

    您可以通过调用在命令行中的文件,你的原始数据作为输入参数重新创建配合和情节。您也可以拨打新的数据文件,并自动安装多个数据集的过程。欲了解更多信息,请参阅从曲线拟合应用程序生成代码

相关话题