交互式装配

基本的拟合UI

在MATLAB®基本的试穿UI,让您交互:

  • 模型数据使用样条插值,形状保持插值,或多项式高达十度

  • 与数据图的一个或多个组合在一起

  • 拟合的残差画出来

  • 计算模型系数

  • 计算残差的范数(可以用来分析模型与数据匹配程度的统计量)

  • 使用模型对数据进行内插或外推

  • 保存系数和计算值到MATLAB工作区对话框使用外

  • 生成MATLAB代码,以重新计算拟合和重新绘制与新的数据

请注意

基本的拟合UI仅适用于二维图形。有关更高级的拟合和回归分析,请参阅曲线拟合工具箱™文档和统计和机器学习工具箱™文档。

基本装配准备

基本的拟合UI在拟合之前对数据进行升序排序。如果数据集很大,而且值没有按升序排序,基本拟合UI在拟合之前对数据进行预处理将花费更长的时间。

您可以加快基础,首先分拣您的数据拟合UI。要创建排序向量x_sortedy_sorted从数据向量xy,使用MATLAB排序功能:

[x_sorted, i] = sort(x);y_sorted = y(我);

打开基本拟合UI

要使用基本拟合UI,你必须首先绘制在图窗口中的数据,使用任何MATLAB绘图产生命令(只)xy数据。

要打开基本拟合界面,选择工具>基本拟合从图窗口顶部的菜单。

示例:使用基本的拟合UI

这个例子说明了如何使用基本拟合UI,以适应,可视化,分析,保存和生成多项式回归代码。

荷载和地块普查数据

该文件census.mat包含在10年为间隔的1790年到1990年美国人口数据。

要加载和绘制数据,请在MATLAB提示符下输入以下命令:

加载人口普查情节(cdate、流行,“罗”)

加载命令将以下变量到MATLAB工作区:

  • CDATE-列向量,从1790年到1990年,以10为增量。它是预测变量。

  • 流行-美国每年人口的列向量CDATE。它是响应变量。

数据载体以升序,按年份排序。该图显示了人口一年的函数。

现在,您可以随着时间的推移,以适应一个方程的数据模型的人口增长。

用三次多项式拟合预测人口普查数据

  1. 通过选择打开基本配件对话框工具>基本拟合在图形窗口中。

  2. 类型的适合区域的基本配件对话框,选择立方体复选框,以适应三次多项式的数据。

    MATLAB使用您的选择来拟合数据,并将三次回归线添加到图中,如下所示。

    在计算合适,MATLAB遇到困难和问题下面的警告:

    这个警告表明模型的计算系数对响应(测量总体)中的随机误差很敏感。它还建议你做一些事情来获得更好的契合度。

  3. 继续使用立方体fit。由于您不能向普查数据添加新的观察结果,所以通过转换您必须转换的值来提高适合度z得分在重新计算适合度之前。选择中心和比例x轴数据复选框,以使基本拟合工具执行转换。

    要了解定心和缩放数据的工作原理,请参见学习基本的拟合工具如何计算拟合

  4. 误差估计(残差),选择显示剩余RMSE复选框。选择酒吧随着情节风格

选择这些选项创建残差为条形图的插曲。

在1790年之前,立方拟合是一个很差的预测,因为它表明人口在减少。这个模型似乎与1790年以后的数据相当接近。然而,残差的模式表明模型不满足正态误差假设,而正态误差是最小二乘拟合的基础。的数据1在图例标识的线所观察到的x(CDATE)和y(流行)的数据值。的立方体回归线礼物中心和缩放数据值后的契合。请注意,该图显示了原始数据单元,即使该工具计算使用转化z分数的拟合。

为了进行比较,试图通过在中选择安装另一个多项式方程的人口普查数据类型的适合区。

查看和保存三次拟合参数

在基本装配对话框中,单击扩张的结果按键以显示所估计的系数和RMSE。

单击,将fit数据保存到MATLAB工作区中导出到工作区数值结果面板上的按钮。打开另存调整到工作区对话框。

选中所有复选框,单击好吧于拟合参数保存为MATLAB结构适合:

适合
适合=具有字段的结构:类型: '多项式度3' _系数:0.9210 25.1834 73.8598 61.7444]

现在,在基本的拟合UI之外,您可以在MATLAB编程中使用拟合结果。

R2,确定系数

通过计算,您可以得到多项式回归预测您观察到的数据有多好的指示确定系数,r平方(写为R2)。R2统计量,范围从0到1,衡量自变量在预测因变量值方面的作用:

  • 的R2接近0的值表明拟合并不比模型好多少y =常数

  • 的R2接近1的值表明自变量解释了大部分因变量的变异性。

R2从计算残差,即观察到的依赖值与拟合值之间的有符号差异。

残差= Y观察到的- ÿ安装 (1)

R2下面是本例中立方拟合的数值0.9988拟合结果在基本试衣对话中。

比较R2对于三次拟合至线性列表方拟合数,选择线性类型的适合并获得将R2数0.921。该结果表明,线性最小二乘方拟合的人口数据的解释了其方差的92.1%。作为该数据的三次拟合解释方差的99.9%,后者似乎是一个更好的预测。然而,由于三次拟合预测使用三个变量(x,x2,x3.),一个基本科研2价值没有充分反映配合如何健壮。评价多元拟合优度更适当的措施是调整后的R2。有关计算和使用调整R的信息2,请参阅残差和拟合优度

内插和外推总体值

假设您想使用立方模型来插值1965年的美国人口(原始数据中没有提供这个日期)。

在基本试穿对话框的下面插值/外推数据, 输入X1965年的价值,并检查情节评估数据盒子。

请注意

使用未缩放和非中心X值。您不需要先居中和缩放,即使您选择了缩放X的系数用三次多项式拟合预测人口普查数据。基本拟合工具,使得在幕后进行必要的调整。

X的值和相应的值F(X)由拟合计算,绘制如下:

生成代码文件以重新生成结果

在完成基本的拟合过程之后,您可以生成MATLAB代码,用新数据重新计算拟合和重新生成绘图。

  1. 在图窗口中,选择文件>生成代码

    这会在MATLAB编辑器的功能并显示它。代码显示了如何以编程方式重现你的基本的拟合对话框中所做的交互。

  2. 更改函数的名称来自第一线createfigure更具体的东西,比如censusplot。代码文件保存到当前文件夹中的文件名censusplot.m函数开头为:

    函数censusplot(X1, Y1, valuesToEvaluate1)

  3. 生成一些新的、随机的令人不安的人口普查数据:

    rng (“默认”) randpop = pop + 10*randn(size(pop));
  4. 用新数据重新绘制图并重新计算拟合:

    censusplot(CDATE,randpop,1965)

    您需要三个输入参数:x, y值(数据1)在原图中绘制,加上x-VALUE为一个标记。

    下图显示了生成的代码生成的图形。新的图与生成代码的图的外观相匹配,除了y数据值,三次拟合方程,以及柱状图中的残余值,如预期的那样。

学习基本的拟合工具如何计算拟合

基本的拟合工具称为polyfit函数来计算多项式拟合。它调用polyval函数来计算拟合值。polyfit分析其输入,以确定是否该数据是公调理配合的要求程度。

当它发现条件不好的数据时,polyfit尽可能地计算回归,但它也返回一个警告,说明适合度可以得到改善。基本拟合示例部分用三次多项式拟合预测人口普查数据显示这个警告。

以提高模型可靠性的一种方法是添加的数据点。然而,增加观测数据集并不总是可行的。另一种策略是改变预测变量正常化其中心和规模。(在该示例中,预测器是人口普查日期的矢量。)

polyfit函数标准化通过计算z得分:

z = x μ σ

在哪里x为预测数据,μ是平均的x,σ的标准差是x。的z-scores给出的数据为0均值为1的标准差在基本拟合UI,你变换预测数据z-通过选择中心和比例x轴数据复选框。

中心和缩放后,模型的系数计算的y数据作为的函数的z。这些是不同的(和更健壮的)比对计算的系数y作为一个功能x。模型的形式和残差的范数不变。基本的拟合UI会自动调整z-分数,使拟合图在相同的尺度上与原始x数据。

要了解如何使用居中和缩放的数据作为创建最终图形的中介,请在命令窗口中运行以下代码:

关闭负载人口普查x = cdate;y =流行;z = (x-mean (x) /性病(x);%计算x数据的z分数积(X,Y,“罗”)%作图数据作为红色标记持有在顶部准备接受新图形的轴zfit = linspace (z(1)、z(结束),100);pz = polyfit (z, y, 3);%计算条件适合yfit = polyval (pz、zfit);xfit = linspace (x(1),(结束),100);情节(xfit yfit,“b -”)%图条件拟合与x数据

以蓝色线为中心的三次多项式曲线,如下图所示:

在代码中,计算z说明如何规范化数据。的polyfit函数本身执行转换,如果你提供三个返回参数时,调用它:

[P,S,μ= polyfit(X,Y,n)的
回归参数,p,现在都是基于规范化的x。返回向量,μ包含的平均值和标准偏差x。有关更多信息,请参见polyfit参考页面。