fitdist

拟合概率分布对象与数据

折叠页面

语法

Pd = fitdist(x,distname)

pd = fitdist(x,distname,Name,Value)

[pdca,gn,gl] = fitdist(x,distname，'By'，groupvar)

[pdca,gn,gl] = fitdist(x,distname，'By'，groupvar,Name,Value)

描述

例子

pd= fitdist (x，distname）指定的分布来创建概率分布对象distname到列向量的数据x。

例子

pd= fitdist (x，distname，名称,值）创建具有由一个或多个名称-值对参数指定的附加选项的概率分布对象。例如，您可以指示删减数据或为迭代拟合算法指定控制参数。

例子

(pdca，gn，gl] = fitdist(x，distname“通过”,groupvar）指定的分布来创建概率分布对象distname中的数据x根据分组变量groupvar。它返回一个拟合概率分布对象的单元数组，pdca，组标签的单元数组，gn，以及分组可变级别的单元格数组，gl。

例子

(pdca，gn，gl] = fitdist(x，distname“通过”,groupvar，名称,值）使用由一个或多个名称-值对参数指定的附加选项返回上述输出参数。例如，您可以指示删减数据或为迭代拟合算法指定控制参数。

例子

全部折叠

拟合数据的正态分布

打开实时脚本

拟合样本数据的正态分布，并使用直方图和分位数-分位数图检验拟合。

从数据文件中加载患者的体重patients.mat。

负载病人x =权重;

通过拟合数据来创建一个正态分布对象。

Pd = fitdist(x，“正常”）

正态分布mu = 154 [148.728, 159.272] sigma = 26.5714 [23.3299, 30.8674]

分布对象显示包括平均值(μ)及标准差(σ)和参数的95%置信区间。

的对象函数pd计算分布并生成随机数。显示支持的对象函数。金宝app

方法(pd)

类的方法。NormalDistribution: cdf iqr negloglik proflik truncate gather mean paramci random var icdf median pdf std

例如，使用。获取95%置信区间paramci函数。

Ci95 = paramci(pd)

ci95 =2×2148.7277 23.3299 159.2723 30.8674

指定显著性水平(α)，以获得具有不同置信水平的置信区间。计算99%置信区间。

Ci99 = paramci(pd，“α”. 01)

ci99 =2×2147.0213 22.4257 160.9787 32.4182

计算并绘制分布的pdf值。

X_values = 50:1:250;Y = pdf(pd,x_values);情节(x_values, y)

图包含一个轴对象。axes对象包含line类型的对象。

创建具有正态分布拟合的直方图histfit函数。histfit使用fitdist拟合数据的分布

histfit (x)

图包含一个轴对象。axis对象包含2个类型为bar, line的对象。

直方图显示数据有两个模态，正态分布拟合的模态在这两个模态之间。

使用qqplot创建样本数据的分位数-分位数图x与拟合分布的理论分位数值比较。

qqplot (x, pd)

图包含一个轴对象。标题为QQ Plot of Sample Data versus Distribution的轴对象包含3个类型为line的对象。

该图不是一条直线，表明数据不服从正态分布。

拟合核分布数据

打开实时脚本

从数据文件中加载患者的体重patients.mat。

负载病人x =权重;

通过将内核分发对象与数据匹配来创建内核分发对象。使用Epanechnikov核函数。

Pd = fitdist(x，“内核”，“内核”，“epanechnikov”）

pd = KernelDistribution内核= epanechnikov带宽= 14.3792支持=无界金宝app

绘制分布的pdf。

X_values = 50:1:250;Y = pdf(pd,x_values);情节(x_values, y)

图包含一个轴对象。axes对象包含line类型的对象。

拟合分组数据的正态分布

打开实时脚本

从数据文件中加载患者的体重和性别patients.mat。

负载病人x =权重;

通过将其拟合到数据中创建正态分布对象，并按患者性别分组。

[pdca,gn,gl] = fitdist(x，“正常”，“通过”、性别)

pdca =1×2单元阵列{1 x1概率。正态分布}{1x1 probb。NormalDistribution}

gn =2 x1细胞{“男”}{“女”}

gl =2 x1细胞{“男”}{“女”}

单元阵列pdca包含两个概率分布对象，每个性别组一个。单元阵列gn包含两个组标签。单元阵列gl包含两个组级别。

查看单元格数组中的每个分布pdca为了比较平均值，μ，标准差，σ，按患者性别分组。

女= pdca{1}女性的百分比分布

正态分布mu = 180.532 [177.833, 183.231] sigma = 9.19322 [7.63933, 11.5466]

男性= pdca{2}男性分布

正态分布mu = 130.472 [128.183, 132.76] sigma = 8.30339 [6.96947, 10.2736]

计算每个分布的pdf。

X_values = 50:1:250;Femalepdf = pdf(female,x_values);Malepdf = pdf(male,x_values);

绘制pdf，以直观地比较按性别分列的体重分布。

图绘制(x_values femalepdf,“线宽”, 2)在情节(x_values malepdf,“颜色”，“r”，“线型”，“:”，“线宽”2)传说(gn,“位置”，“东北”)举行从

图包含一个轴对象。axes对象包含2个line类型的对象。这些物体代表男性，女性。

拟合核分布到分组数据

打开实时脚本

从数据文件中加载患者的体重和性别patients.mat。

负载病人x =权重;

通过将其拟合到数据中来创建内核分布对象，并按患者性别分组。使用三角核函数。

[pdca,gn,gl] = fitdist(x，“内核”，“通过”、性别、“内核”，“三角形”）;

查看单元格数组中的每个分布pdca查看每个性别的内核分布。

女= pdca{1}女性的百分比分布

female = KernelDistribution Kernel = triangle Bandwidth = 5.08961 金宝appSupport = unbounded

男性= pdca{2}男性分布

male = KernelDistribution Kernel = triangle Bandwidth = 4.25894 金宝appSupport = unbounded

计算每个分布的pdf。

X_values = 50:1:250;Femalepdf = pdf(female,x_values);Malepdf = pdf(male,x_values);

绘制pdf，以直观地比较按性别分列的体重分布。

图绘制(x_values femalepdf,“线宽”, 2)在情节(x_values malepdf,“颜色”，“r”，“线型”，“:”，“线宽”2)传说(gn,“位置”，“东北”)举行从

图包含一个轴对象。axes对象包含2个line类型的对象。这些物体代表男性，女性。

输入参数

全部折叠

`x`- - - - - -输入数据
列向量

输入数据，指定为列向量。fitdist忽略了南值x。此外,任何南值在滤波矢量或频率矢量引起fitdist中对应的值x。

数据类型:双

`distname`- - - - - -分布的名字
特征向量|字符串标量

分发名称，指定为以下字符向量或字符串标量之一。指定的分布distname确定返回的概率分布对象的类型。

分布的名字	描述	分布对象
`“β”`	贝塔分布	`BetaDistribution`
`“二”`	二项分布	`BinomialDistribution`
`“BirnbaumSaunders”`	Birnbaum-Saunders分布	`BirnbaumSaundersDistribution`
`“毛刺”`	毛刺分布	`BurrDistribution`
`“指数”`	指数分布	`ExponentialDistribution`
`“极端值”`或`“电动汽车”`	极值分布	`ExtremeValueDistribution`
`“伽马”`	伽马分布	`GammaDistribution`
`“广义极值”`或`“gev”`	广义极值分布	`GeneralizedExtremeValueDistribution`
`广义帕累托的`或`“全科医生”`	广义帕累托分布	`GeneralizedParetoDistribution`
`“正常”的一半`或`“环”`	Half-normal分布	`HalfNormalDistribution`
`“InverseGaussian”`	逆高斯分布	`InverseGaussianDistribution`
`“内核”`	内核分配	`KernelDistribution`
`“物流”`	物流配送	`LogisticDistribution`
`“Loglogistic”`	Loglogistic分布	`LoglogisticDistribution`
`对数正态的`	对数正态分布	`LognormalDistribution`
`“Nakagami”`	Nakagami分布	`NakagamiDistribution`
`“负二项”`或`“nbin”`	负二项分布	`NegativeBinomialDistribution`
`“正常”`	正态分布	`NormalDistribution`
`“泊松”`	泊松分布	`PoissonDistribution`
`“瑞利”`	瑞利分布	`RayleighDistribution`
`“Rician”`	Rician分布	`RicianDistribution`
`“稳定”`	稳定分布	`StableDistribution`
`“tLocationScale”`	tLocation-Scale分布	`tLocationScaleDistribution`
`“威布尔”`或`“wbl”`	威布尔分布	`WeibullDistribution`

`groupvar`- - - - - -分组变量
分类数组|逻辑或数字矢量|字符数组|字符串数组|字符向量的单元数组

分组变量，指定为分类数组、逻辑或数字向量、字符数组、字符串数组或字符向量的单元格数组。分组变量中的每个惟一值定义一个组。

例如，如果性别是具有值的字符向量的单元格数组“男”和“女”，你可以用性别作为分组变量，按性别拟合数据的分布。

通过指定分组变量的单元格数组，可以使用多个分组变量。如果所有指定的分组变量的值相同，则将观察值放在同一组中。

例如，如果吸烟者逻辑向量有值吗0对于不吸烟者和1对于吸烟者，则指定单元格数组{性别、吸烟}将观察结果分为四组:男性吸烟者、男性不吸烟者、女性吸烟者和女性不吸烟者。

例子:{性别、吸烟}

数据类型:分类|逻辑|单|双|字符|字符串|细胞

名称-值参数

指定可选的逗号分隔对名称,值参数。名字是参数名和吗价值是对应的值。名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数，如Name1, Value1,…,的家。

例子:fitdist (x,“仁”,“仁”,“三角形”)将内核分布对象与中的数据匹配x用三角核函数。

`审查`- - - - - -删除数据的逻辑标志
`0`(默认)|逻辑值向量

截尾数据的逻辑标志，指定为与输入向量大小相同的逻辑值向量x。值为1当对应的元素在x经过正确审查的观察和0当对应的元素是一个精确的观测值时。默认是的向量0S，表示所有的观测值都是准确的。

fitdist忽略任何一个南这个滤波向量中的值。此外,任何南值x或者频率矢量的原因fitdist忽略截断向量中的相应值。

只有当distname是“BirnbaumSaunders”，“毛刺”，“指数”，“ExtremeValue”，“伽马”，“InverseGaussian”，“内核”，“物流”，“Loglogistic”，对数正态的，“Nakagami”，“正常”，“Rician”，“tLocationScale”,或“威布尔”。

数据类型:逻辑

`频率`- - - - - -观察频率
`1`(默认)|非负整数值的向量

观测频率，指定为与输入向量大小相同的非负整数值向量x。频率向量的每个元素指定中对应元素的频率x。默认是的向量1S，表示中的每个值x只出现一次。

fitdist忽略任何一个南这个频率向量中的值。此外,任何南值x或者是滤波向量的原因fitdist忽略频率矢量中相应的值。

数据类型:单|双

`选项`- - - - - -控制参数
结构

迭代拟合算法的控制参数，指定为使用创建的结构statset。

数据类型:结构体

`NTrials`- - - - - -二项分布试验数
1(默认)|正整数值

二项分布的试验次数，指定为正整数值。

此参数仅在以下情况下有效distname是“二”(二项分布)。

例子:“Ntrials”,10

数据类型:单|双

`θ`- - - - - -广义Pareto分布的位置(阈值)参数
标量值

广义帕累托分布的位置(阈值)参数，用标量指定。

此参数仅在以下情况下有效distname是广义帕累托的(广义Pareto分布)。

默认值为0x只包含非负值。你必须说明θ如果x包括负值。

例子:“θ”,1

数据类型:单|双

`μ`- - - - - -半正态分布的位置参数
标量值

半正态分布的位置参数，指定为标量。

此参数仅在以下情况下有效distname是“正常”的一半(half-normal分布)。

默认值为0x只包含非负值。你必须说明μ如果x包括负值。

例子:“亩”,1

数据类型:单|双

`内核`- - - - - -内核分发的内核平滑类型
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`

内核发行版的内核平滑类型，指定为以下之一:

“正常”
“盒子”
“三角形”
“epanechnikov”

你必须说明distname作为“内核”要使用此选项。

`金宝app`- - - - - -支持内核分布的内核密度金宝app
`“无限”`(默认)|`“积极”`|双元素向量

内核分布的内核密度支持，指定为金宝app“无限”，“积极”，或者一个双元素向量。

价值	描述
`“无限”`	密度可以延伸到整条实线。
`“积极”`	密度被限制为正值。

或者，您可以指定一个双元素向量，给出有限的下限和上限，以支持密度。金宝app

你必须说明distname作为“内核”要使用此选项。

数据类型:单|双|字符|字符串

`宽度`- - - - - -核分布的核平滑窗带宽
标量值

核分布的核平滑窗口的带宽，用标量值指定。使用的默认值fitdist是估计正常密度的最佳值，但您可能希望选择较小的值来显示多模式等特征。你必须说明distname作为“内核”要使用此选项。

数据类型:单|双

输出参数

全部折叠

`pd`-概率分布
概率分布对象

概率分布，作为概率分布对象返回。指定的分布distname确定返回的概率分布对象的类类型。如欲查阅distname值和对应的概率分布对象，参见distname。

`pdca`-概率分布对象
单元阵列

指定类型的概率分布对象distname，作为单元格数组返回。如欲查阅distname值和对应的概率分布对象，参见distname。

`gn`-分组标签
字符向量的单元数组

分组标签，作为字符向量的单元格数组返回。

`gl`-分组可变级别
字符向量的单元数组

分组变量级别，作为字符向量的单元格数组返回，每个分组变量包含一列。

算法

的fitdist函数拟合使用最大似然估计的大多数分布。两种例外情况是未经审查数据的正态分布和对数正态分布。

对于无截尾正态分布，sigma参数的估计值是方差无偏估计值的平方根。
对于未删减对数正态分布，sigma参数的估计值是数据对数方差无偏估计值的平方根。

选择功能

的分布更健康App打开一个图形用户界面，让你从工作区导入数据，并以交互方式拟合该数据的概率分布。然后，您可以将该分布保存为一个概率分布对象。打开分布筛选器应用程序使用distributionFitter，或单击“应用程序”选项卡上的“分发筛选器”。
若要将分布拟合到左截尾、双截尾或间隔截尾数据，请使用大中型企业。可以找到最大似然估计大中型企业函数创建一个概率分布对象makedist函数。使用示例请参见寻找双重审查数据的最大似然。

参考文献

[1]约翰逊，n.l.， S. Kotz和N.巴拉克里希南。连续单变量分布。第1卷，霍博肯，NJ: Wiley-Interscience, 1993。

[2]约翰逊，n.l.， S. Kotz和N.巴拉克里希南。连续单变量分布。第2卷，霍博肯，NJ: Wiley-Interscience, 1994。

鲍曼，A. W.和A.阿扎利尼。应用平滑技术进行数据分析。纽约:牛津大学出版社，1997。

扩展功能

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制:

金宝app支持的语法有:
```
pd= fitdist (x，distname）pd= fitdist (x，distname，名称,值）
```
代码生成不支持包含分组变量的语法金宝app“通过”,groupvar以及相关的输出参数pdca，gn,gl。
fitdist金宝app支持beta、指数、极值、对数正态、正态和威布尔分布的代码生成。
- 的价值distname可以“β”，“指数”，“ExtremeValue”，对数正态的，“正常”或“威布尔”。
- 的价值distname必须是编译时常数。
的值x，“审查”,“频率”不得包含南值。
代码生成忽略“频率”的值。而不是指定“频率”值，手动将重复的值添加到x所以这些值x有你想要的频率。
代码生成不支持这些输入参数:金宝appgroupvar，NTrials，θ，μ，内核，金宝app,宽度。
名称-值对参数中的名称必须是编译时常量。
这些对象函数pd金宝app支持代码生成:提供，icdf，位差，的意思是，中位数，pdf，性病，截断,var。

有关代码生成的更多信息，请参见代码生成简介和概率分布对象的代码生成。

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

使用注意事项和限制:

不能指定输入参数distname作为“Rician”或“稳定”。

有关更多信息，请参见在GPU上运行MATLAB函数(并行计算工具箱)。

另请参阅

主题

在R2009a中引入

fitdist

语法

描述

例子

拟合数据的正态分布

拟合核分布数据

拟合分组数据的正态分布

拟合核分布到分组数据

输入参数

`x`- - - - - -输入数据
列向量

`distname`- - - - - -分布的名字
特征向量|字符串标量

`groupvar`- - - - - -分组变量
分类数组|逻辑或数字矢量|字符数组|字符串数组|字符向量的单元数组

名称-值参数

`审查`- - - - - -删除数据的逻辑标志
`0`(默认)|逻辑值向量

`频率`- - - - - -观察频率
`1`(默认)|非负整数值的向量

`选项`- - - - - -控制参数
结构

`NTrials`- - - - - -二项分布试验数
1(默认)|正整数值

`θ`- - - - - -广义Pareto分布的位置(阈值)参数
标量值

`μ`- - - - - -半正态分布的位置参数
标量值

`内核`- - - - - -内核分发的内核平滑类型
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`

`金宝app`- - - - - -支持内核分布的内核密度金宝app
`“无限”`(默认)|`“积极”`|双元素向量

`宽度`- - - - - -核分布的核平滑窗带宽
标量值

输出参数

`pd`-概率分布
概率分布对象

`pdca`-概率分布对象
单元阵列

`gn`-分组标签
字符向量的单元数组

`gl`-分组可变级别
字符向量的单元数组

算法

选择功能

参考文献

扩展功能

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:MATLAB分步指南

fitdist

语法

描述

例子

拟合数据的正态分布

拟合核分布数据

拟合分组数据的正态分布

拟合核分布到分组数据

输入参数

x- - - - - -输入数据列向量

distname- - - - - -分布的名字特征向量|字符串标量

groupvar- - - - - -分组变量分类数组|逻辑或数字矢量|字符数组|字符串数组|字符向量的单元数组

名称-值参数

审查- - - - - -删除数据的逻辑标志0(默认)|逻辑值向量

频率- - - - - -观察频率1(默认)|非负整数值的向量

选项- - - - - -控制参数结构

NTrials- - - - - -二项分布试验数1(默认)|正整数值

θ- - - - - -广义Pareto分布的位置(阈值)参数标量值

μ- - - - - -半正态分布的位置参数标量值

内核- - - - - -内核分发的内核平滑类型“正常”(默认)|“盒子”|“三角形”|“epanechnikov”

金宝app- - - - - -支持内核分布的内核密度金宝app“无限”(默认)|“积极”|双元素向量

宽度- - - - - -核分布的核平滑窗带宽标量值

输出参数

pd-概率分布概率分布对象

pdca-概率分布对象单元阵列

gn-分组标签字符向量的单元数组

gl-分组可变级别字符向量的单元数组

算法

选择功能

参考文献

扩展功能

C/ c++代码生成使用MATLAB®Coder™生成C和c++代码。

GPU数组通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:MATLAB分步指南

`x`- - - - - -输入数据
列向量

`distname`- - - - - -分布的名字
特征向量|字符串标量

`groupvar`- - - - - -分组变量
分类数组|逻辑或数字矢量|字符数组|字符串数组|字符向量的单元数组

`审查`- - - - - -删除数据的逻辑标志
`0`(默认)|逻辑值向量

`频率`- - - - - -观察频率
`1`(默认)|非负整数值的向量

`选项`- - - - - -控制参数
结构

`NTrials`- - - - - -二项分布试验数
1(默认)|正整数值

`θ`- - - - - -广义Pareto分布的位置(阈值)参数
标量值

`μ`- - - - - -半正态分布的位置参数
标量值

`内核`- - - - - -内核分发的内核平滑类型
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`

`金宝app`- - - - - -支持内核分布的内核密度金宝app
`“无限”`(默认)|`“积极”`|双元素向量

`宽度`- - - - - -核分布的核平滑窗带宽
标量值

`pd`-概率分布
概率分布对象

`pdca`-概率分布对象
单元阵列

`gn`-分组标签
字符向量的单元数组

`gl`-分组可变级别
字符向量的单元数组

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。