使用分布钳工应用程序建模数据
Distribution Fitter应用程序提供了一个可视化的、交互式的方法来拟合单变量分布到数据。
交互式地探索概率分布
您可以使用Distribution Fitter应用程序以交互方式将概率分布拟合到从MATLAB导入的数据®工作区。您可以从22个内置概率分布中进行选择,也可以创建自己的自定义分布。该应用程序显示了在经验分布的图上的拟合分布,包括pdf, cdf,概率图和幸存者函数。您可以将拟合数据(包括拟合参数值)导出到工作空间以进行进一步分析。
分发钳工应用程序工作流
拟合样本数据的概率分布:
在MATLAB工具条上,单击“应用程序”选项卡。在数学、统计和优化组中,打开Distribution Fitter应用程序。或者,在命令提示符下,输入
distributionFitter
.导入您的示例数据,或直接在应用程序中创建数据向量。您还可以管理您的数据集,并选择哪一个适合。看到创建和管理数据集.
为您的数据创建一个新的适合。看到打造一套新衣服.
显示适合的结果。您可以选择显示密度(pdf)、累积概率(cdf)、分位数(逆cdf)、概率图(从几个分布中选择一个)、幸存者函数和累积风险。看到显示结果.
您可以在应用程序内创建其他适配,并管理多个适配管理符合.
评估拟合的概率函数。您可以选择评估密度(pdf)、累积概率(cdf)、分位数(逆cdf)、幸存者函数和累积风险。看到评估适合.
通过排除某些数据来改善拟合。您可以指定要排除的数据的界限,也可以使用示例数据中的值的图形来排除数据。看到排除数据.
保存当前的Distribution Fitter应用程序会话,以便稍后打开它。看到保存和加载会话.
创建和管理数据集
要打开“数据”对话框,请单击数据按钮在分配钳工应用程序。
导入数据
方法从MATLAB工作区导入向量,从而创建数据集导入工作区向量选项。
数据-在数据字段时,下拉列表包含MATLAB工作空间中除1乘1矩阵(标量)外的所有矩阵和向量的名称。选择包含要拟合的数据的数组。实际导入的数据必须是一个向量。中选择的矩阵数据字段时,默认导入矩阵的第一列。若要选择矩阵的其他列或行,请单击选择列或行.矩阵出现在“选择列或行”对话框中。您可以通过突出显示来选择行或列。
或者,您也可以在数据字段。
当你选择一个向量数据字段时,数据的直方图将出现在数据预览窗格。
审查—如果数据集中的某些点被截尾,则输入与数据向量大小相同的布尔向量,指定数据的截尾项。一个
1
在审查向量中,指定对数据向量的相应条目进行审查。一个0
指定不审查条目。输入矩阵时,可以单击选择列或行选择列或行.如果没有经过审查的数据,请离开审查字段空白。频率—输入与数据向量相同大小的正整数向量,指定该数据向量对应条目的出现频率。例如,值
7
在频率向量的第15项中,指定有7个数据点对应于数据向量的第15项中的值。如果数据向量的所有项的频率为1,则保留频率字段空白。数据集名称—输入从工作空间导入的数据集的名称,例如
我的数据
.
输入完上述信息后,单击创建数据集创建数据集我的数据
.
管理数据集
控件创建的数据集管理数据集窗格。创建数据集时,其名称将出现在数据集列表。如下图所示管理数据集窗格中创建的数据集我的数据
.
中的每个数据集数据集列表,你可以:
选择情节复选框,在主要的Distribution Fitter应用程序窗口中显示数据的图形。当你创建一个新的数据集时,情节默认选中。清理情节复选框将从主窗口中的绘图中删除数据。控件中显示的图形类型显示类型字段。
如果情节被选中后,还可以选择吗设计范围在主窗口中显示绘图的置信区间界限。这些界限是围绕这些函数的经验估计的逐点置信界限。只有当您设置边界时才会显示显示类型在主窗口中选择以下之一:
累积概率
幸存者函数
累积的风险
分布检验器应用程序无法显示密度的置信界限(PDF
),分位数(逆CDF实验组的
),或概率图。清理设计范围复选框将从主窗口中的绘图中删除置信度范围。
当您从列表中选择数据集时,您可以访问以下按钮:
视图—在新窗口中以表格形式显示数据。
设置Bin规则-定义密度(PDF)图中使用的直方图箱。
重命名—重命名数据集。
删除—删除数据集。
设置Bin规则
单击,设置数据集直方图的bin规则设置Bin规则打开设置Bin规则对话框。
您可以从以下规则中选择:
Freedman-Diaconis规则-基于样本大小和数据分布自动选择bin宽度和位置的算法。该规则是默认的,适用于许多类型的数据。
斯科特规则—用于近似正常数据的算法。该算法自动选择bin的宽度和位置。
箱数—输入箱数。所有的箱子都有相同的宽度。
以整数为中心的箱子—以整数为中心的bin。
本宽度—输入每个bin的宽度。如果您选择此选项,您还可以选择:
自动放箱-将箱子的边缘放置在的整数倍本宽度.
料仓边界—输入标量,指定装箱的边界。每个容器的边界等于这个标量加上的整数倍本宽度.
你还可以:
应用于所有现有数据集—对所有数据集应用此规则。否则,该规则仅应用于“数据”对话框中当前选择的数据集。
另存为默认-将当前规则应用于您创建的任何新数据集。您可以通过选择设置默认的bin宽度规则设置默认Bin规则从工具菜单在主窗口。
打造一套新衣服
单击新健康单击主窗口顶部的按钮,打开New Fit对话框。如果您创建了数据集我的数据
,它出现在数据字段。
字段名 | 描述 |
---|---|
适合的名字 | 输入合适的名称。 |
数据 | 从下拉列表中选择要拟合分布的数据集。 |
分布 | 类型中选择要适合的分布类型分布下拉列表。 中只显示应用于所选数据集的值的分布分布字段。例如,当数据包含0或负的值时,不显示正分布。 可以指定参数分布或非参数分布。从下拉列表中选择参数分布时,将显示其参数的描述。分布拟合器估计这些参数以拟合数据集的分布。如果选择二项分布或广义极值分布,则必须为其中一个参数指定固定值。该窗格包含一个文本字段,您可以在其中指定该参数。 当你选择 |
排除规则 | 指定一个规则来排除一些数据。单击,创建排除规则排除在Distribution Fitter应用程序中。有关更多信息,请参阅排除数据. |
应用新Fit
点击应用来拟合分布。对于参数拟合,为结果窗格显示估计参数的值。对于非参数拟合,为结果窗格显示有关配合的信息。
当你点击应用时,Distribution Fitter应用程序会显示分布图和相应的数据。
请注意
当你点击应用时,对话框的标题变为“Edit Fit”。您现在可以对刚刚创建的适合进行更改并单击应用再次拯救他们。关闭“编辑合身”对话框后,您可以随时从“合身管理器”对话框中重新打开该对话框以编辑合身。
应用拟合后,您可以通过单击使用概率分布对象将信息保存到工作区保存到工作区.
可用的分布
分布检验器应用程序中提供的所有分布都在统计和机器学习工具箱™软件的其他地方得到支持。金宝app您可以使用fitdist
函数来拟合应用程序支持的任何发行版。许多发行版也有专门的拟合函数。金宝app这些函数计算Distribution Fitter应用程序中的大部分拟合,并在以下列表中引用。其他拟合是使用Distribution Fitter应用程序内部的函数计算的。
并非所有列出的发行版都适用于所有数据集。分布检验器应用程序确定数据的范围(非负的,单位间隔,等等),并显示适当的分布分布下拉列表。分布数据范围在下面的列表中以括号表示。
Birnbaum-Saunders(正值)分布。
十二型毛刺(正值)分布。
逆高斯分布(正值)分布。
物流(所有值)分布。
Loglogistic(正值)分布。
Nakagami(正值)分布。
Rician(正值)分布。
tlocation-scale(所有值)分布。
非参数拟合的进一步选项
当你选择非参数
在分布属性中显示一组选项非参数窗格,如下图所示。
非参数分布的选项有:
内核—使用的内核函数类型。
正常的
盒子
三角形
Epanechnikov
带宽—内核平滑窗口带宽。选择汽车用于估计正常密度的最佳默认值。点击之后应用时,此值出现在结果窗格。选择指定然后输入一个较小的值来显示多个模式等特征,或者输入一个较大的值来使拟合更平滑。
域-允许的x-values为密度。
无限-密度扩展到整个实线。
积极的-密度限制为正值。
指定—输入密度域的下界和上界。
当你选择积极的或指定时,非参数拟合在指定域外的概率为零。
显示结果
分布检验器应用程序窗口显示的图:
您所选择的数据集情节在“数据”对话框中。
您所选择的适合度情节在“适配管理器”对话框中。
置信范围为:
您所选择的数据集设计范围在“数据”对话框中。
您所选择的适合度设计范围在“适配管理器”对话框中。
以下字段是可用的。
显示类型
属性指定要显示的图形类型显示类型字段在主应用程序窗口。每种类型对应一个概率函数,例如,概率密度函数。您可以选择以下显示类型:
密度(PDF)
-显示拟合分布的概率密度函数(PDF)图。主窗口使用概率直方图显示数据集,其中每个矩形的高度是位于容器中的数据点的分数除以容器的宽度。这使得矩形的面积之和等于1。累积概率
-显示数据的累积概率图。主窗口显示使用累积概率步进函数的数据集。每一步的高度是概率直方图中矩形高度的累积和。分位数(逆CDF)
-显示分位数(逆CDF)图。概率图
-显示数据的概率图。中指定用于构造概率图的分布类型分布字段。此字段仅在选择时可用概率图
.分布的选择是:指数
极值
正常的一半
Log-Logistic
物流
对数正态
正常的
瑞利
威布尔
方法中创建的参数拟合也可以创建概率图新健康对话框。的底部添加这些拟合分布下拉列表。
幸存者函数
-显示数据的幸存者函数图。累积的风险
-显示数据的累积危害图。请注意
如果绘制的数据包括
0
或者是负值,一些分布是不可用的。
信心界限
您可以在设置时显示数据集的置信范围和拟合显示类型来累积概率
,幸存者函数
,累积的风险
,或者,只适用于分位数(逆CDF)
.
若要显示数据集的边界,请选择设计范围的数据集旁边的管理数据集窗格中的“数据”对话框。
若要显示拟合的边界,请选择设计范围在fit Manager对话框中的fit旁边。并不是所有适合类型的置信范围都可用。
若要设置边界的置信水平,请选择置信水平
从视图菜单,并从选项中进行选择。
管理符合
单击管理符合按钮,打开配合经理对话框。
的拟合表使用以下选项显示您创建的匹配项的列表:
情节-在Distribution Fitter应用程序的主窗口显示适合度的图形。当你创建一个新的适合度时,情节默认选中。清理情节复选框将从主窗口中的绘图中移除拟合。
设计范围—如果选择情节,您也可以选择设计范围在情节中展示自信的界限。设置边界时显示显示类型在主窗口中选择以下之一:
累积概率
分位数(逆CDF)
幸存者函数
累积的风险
分布检验器应用程序无法显示密度的置信界限(
PDF
)或概率图。非参数拟合和某些参数拟合不支持金宝app边界。清理设计范围复选框从主窗口中的绘图中删除置信区间。
当你选择一个合适的拟合表时,表格下方启用以下按钮:
新健康-打开New Fit窗口。
复制-创建所选适合的副本。
编辑-打开“编辑合身”对话框,编辑合身。
请注意
您只能在“编辑适配”对话框中编辑当前选定的适配。要编辑不同的拟合,请在拟合表并点击编辑打开另一个“编辑适配”对话框。
保存到工作区—将选择的拟合保存为分布对象。
删除—删除所选fit。
评估适合
使用评估对话框计算所选任何数据点上的拟合分布。若要打开对话框,请单击评估按钮。
在评估对话框中,从以下项目中进行选择:
适合窗格-显示现有适合的名称。选择一个或多个要评估的匹配项。使用特定于平台的功能,您可以选择多个适配。
函数-选择要评估拟合的概率函数类型。可用的函数有:
密度(PDF)
-计算概率密度函数。累积概率
—计算累积概率函数。分位数(逆CDF)
—计算分位数(CDF逆)函数。幸存者函数
—计算存活函数。累积的风险
—计算累积危险函数。故障率
—计算危险率。
在x =-输入一个点向量或一个工作区变量的名称,其中包含要计算分布函数的点向量。如果你改变函数来
分位数(逆CDF)
,字段名变为在p =,然后输入一个概率值向量。计算置信范围—选中此框计算所选拟合的置信范围。该复选框仅当您设置函数致下列其中一项:
累积概率
分位数(逆CDF)
幸存者函数
累积的风险
分布拟合器应用程序无法计算非参数拟合和某些参数拟合的置信界限。在这些情况下,它会返回
南
求积分限。水平—设置置信限的级别。
绘制函数-选择此框以显示分布函数的图形,在中输入的点处进行评估在x =字段,在一个新窗口中。
请注意
的设置计算置信范围,水平,绘制函数不会影响在Distribution Fitter应用程序的主窗口中显示的图。该设置仅适用于您通过单击绘制函数在评估窗口。
若要将这些评估设置应用于所选匹配,请单击应用.下图显示了对拟合的累积密度函数进行评估的结果我的健康,在向量上的点5:4:45
.
表的右边的列适合窗格显示以下值:
X -你输入的向量的元素在x =字段。
F(X) -在X的项上的CDF的对应值。
LB -置信区间的下界,如果您选择的话计算置信范围.
UB -置信区间的上界,如果您选择计算置信范围.
若要将表格中显示的数据保存为MATLAB工作区中的矩阵,请单击导出到工作区.
排除数据
要排除适合的值,请打开排除通过单击排除按钮。在排除窗口中,您可以创建排除指定数据值的规则。当你在新健康窗口中,您可以使用这些规则排除适合的数据。
创建一个排除规则。
排除规则名称—输入排除规则的名称。
排除部分—为排除的数据指定边界:
在下限:排除数据下拉列表,选择
< =
或<
并在右侧字段中输入一个标量值。根据您选择的操作符,应用程序将分别从拟合中排除小于或等于标量值或小于标量值的任何数据值。在上限:不包含数据下拉列表,选择
> =
或>
并在右侧字段中输入一个标量值。根据您选择的操作符,应用程序将分别从拟合中排除大于或等于标量值或大于标量值的任何数据值。
或
单击排除图形按钮,通过显示数据集中值的图形并选择被排除数据的边界来定义排除规则。例如,如果您创建了数据集
我的数据
如创建和管理数据集中所述,从选择数据下拉列表,然后单击排除图形按钮。应用程序显示的值我的数据
在一个新窗口。单击,可设置排除区域的边界下限添加下限.该应用程序在绘图窗口的左侧显示一条垂直线。将该线移动到需要下限的点,如下图所示。
控件中显示的值可移动垂直线下限:排除数据在排除窗口。
显示的值对应x垂直线的-坐标。
同样,单击,可以设置排除区域的边界上限添加上限,然后移动出现在绘图窗口右侧的垂直线。设置完上下限后,单击关闭并返回“排除”窗口。
创建排除规则—设置排除数据的上限和下限后,单击创建排除规则创建新规则。新规则的名称出现在现有的排除规则窗格。
属性中选择排除规则现有的排除规则窗格启用以下按钮:
复制-创建规则的副本,然后可以对其进行修改。单击,将修改后的规则保存在另一个名称下创建排除规则.
视图-打开一个新窗口,在其中可以看到被规则排除的数据点。典型示例如下图所示。
图中的阴影区域以图形方式显示哪些数据点被排除在外。右边的表格列出了所有的数据点。阴影行表示排除点。
重命名—重命名规则。
删除—删除规则。
定义排除规则后,可以在为数据拟合分布时使用它。该规则不会从数据集的显示中排除点。
保存和加载会话
将您的工作保存在当前会话中,然后在后续会话中加载它,以便您可以继续在中断的地方工作。
保存会话
要保存当前会话,请从文件菜单在主窗口中选择保存会话
.例如,会打开一个对话框,提示您输入一个文件名my_session.dfit
.点击保存保存当前会话中创建的以下项:
数据集
适合
排除规则
情节的设置
箱子宽度规则
加载会话
方法加载先前保存的会话文件菜单在主窗口中选择负载会话
.输入以前保存的会话的名称。点击开放将信息从保存的会话恢复到当前会话。
生成一个文件来适应和绘制分布
使用生成代码
选项中的文件菜单创建一个文件:
将当前会话中的分布拟合到MATLAB工作区中的任何数据向量。
绘制数据和拟合图。
结束当前会话后,可以使用该文件在标准MATLAB图形窗口中创建图表,而无需重新打开Distribution Fitter应用程序。
例如,如果您创建了中描述的拟合打造一套新衣服,执行以下步骤:
从文件菜单中,选择
生成代码
.在MATLAB编辑器窗口中,选择文件>保存为.将文件另存为
normal_fit.m
在MATLAB路径下的文件夹中。
然后可以应用该函数normal_fit
到MATLAB工作空间中的任何数据向量。例如,命令如下:
New_data = normrnd(4.1, 12.5, 100, 1);Newfit = normal_fit(new_data)“新数据”,“我的健康”)
生成newfit
为数据的拟合正态分布。这些命令还生成数据和拟合图。
正态分布mu = 5.63857 [2.7555, 8.52163] sigma = 14.53 [12.7574, 16.8791]
请注意
默认情况下,该文件使用与Distribution Fitter应用程序中的数据集相同的名称来标记图例中的数据传说
命令,如前面的示例所示。