fitdist

拟合概率分布对象与数据

折叠所有页面

语法

Pd = fitdist(x,distname)

pd = fitdist(x,distname,Name,Value)

[pdca,gn,gl] = fitdist(x,distname，'By'，groupvar)

[pdca,gn,gl] = fitdist(x,distname，'By'，groupvar,Name,Value)

描述

例子

pd= fitdist (x，distname）通过拟合指定的分布来创建概率分布对象distname到列向量中的数据x．

例子

pd= fitdist (x，distname，名称,值）创建具有由一个或多个名称-值对参数指定的附加选项的概率分布对象。例如，您可以指示截尾数据或为迭代拟合算法指定控制参数。

例子

［pdca，gn，gl= fitdist(x，distname“通过”,groupvar）通过拟合指定的分布来创建概率分布对象distname的数据x基于分组变量groupvar．它返回一个由拟合的概率分布对象组成的单元格数组，pdca，组标签的单元格数组，gn，以及分组变量级别的单元格数组，gl．

例子

［pdca，gn，gl= fitdist(x，distname“通过”,groupvar，名称,值）使用由一个或多个名-值对参数指定的附加选项返回上述输出参数。例如，您可以指示截尾数据或为迭代拟合算法指定控制参数。

例子

全部折叠

拟合数据的正态分布

打开实时脚本

拟合样本数据的正态分布，并使用直方图和分位数-分位数图检查拟合。

从数据文件中加载病人体重patients.mat．

负载病人x =重量;

通过拟合数据来创建一个正态分布对象。

Pd = fitdist(x，“正常”）

正态分布mu = 154 [148.728, 159.272] sigma = 26.5714 [23.3299, 30.8674]

分布对象显示包括平均值(μ)和标准差(σ)，以及各参数的95%置信区间。

的对象函数pd求分布并生成随机数。显示支持的对象函数。金宝app

方法(pd)

类问题的方法。NormalDistribution: cdf iqr negloglik proflik truncate gather mean paramci random var icdf median pdf std

方法获得95%置信区间paramci函数。

Ci95 = paramci(pd)

ci95 =2×2148.7277 23.3299 159.2723 30.8674

指定显著性水平(α)，得到不同置信水平的置信区间。计算99%置信区间。

Ci99 = paramci(pd，“α”. 01)

ci99 =2×2147.0213 22.4257 160.9787 32.4182

评估并绘制分布的pdf值。

X_values = 50:1:250;Y = pdf(pd,x_values);情节(x_values, y)

图中包含一个轴对象。axis对象包含一个line类型的对象。

方法创建正态分布拟合的直方图histfit函数。histfit使用fitdist拟合数据的分布。

histfit (x)

图中包含一个轴对象。axis对象包含两个类型为bar、line的对象。

直方图显示数据有两种模式，正态分布拟合的模式介于这两种模式之间。

使用qqplot创建样本数据的分位数-分位数图x相对于拟合分布的理论分位数值。

qqplot (x, pd)

图中包含一个轴对象。标题为QQ Plot of Sample Data versus Distribution的坐标轴对象包含3个类型为line的对象。

图表不是一条直线，这表明数据不遵循正态分布。

适合核分布到数据

打开实时脚本

从数据文件中加载病人体重patients.mat．

负载病人x =重量;

通过将内核分发对象与数据匹配来创建内核分发对象。使用Epanechnikov核函数。

Pd = fitdist(x，“内核”，“内核”，“epanechnikov”）

pd = KernelDistribution内核= epanechnikov带宽= 14.3792支持=无界金宝app

绘制分布的pdf。

X_values = 50:1:250;Y = pdf(pd,x_values);情节(x_values, y)

图中包含一个轴对象。axis对象包含一个line类型的对象。

拟合正态分布到分组数据

打开实时脚本

从数据文件中加载患者体重和性别patients.mat．

负载病人x =重量;

通过拟合数据来创建正态分布对象，并按患者性别分组。

[pdca,gn,gl] = fitdist(x，“正常”，“通过”、性别)

pdca =1×2单元格数组{1 x1概率。NormalDistribution} {1x1问题。NormalDistribution}

gn =2 x1细胞{'男'}{'女'}

gl =2 x1细胞{'男'}{'女'}

单元格数组pdca包含两个概率分布对象，每个性别组一个。单元格数组gn包含两个组标签。单元格数组gl包含两个组级别。

查看单元格数组中的每个分布pdca为了比较平均值，μ，为标准差，σ，按患者性别分组。

女性= pdca{1}%女性分布

正态分布mu = 180.532 [177.833, 183.231] sigma = 9.19322 [7.63933, 11.5466]

男性= pdca{2}男性百分比分布

正态分布mu = 130.472 [128.183, 132.76] sigma = 8.30339 [6.96947, 10.2736]

计算每个分布的pdf。

X_values = 50:1:250;Femalepdf = pdf(female,x_values);Malepdf = pdf(male,x_values);

绘制pdf图，按性别进行体重分布的可视化比较。

图绘制(x_values femalepdf,“线宽”, 2)在情节(x_values malepdf,“颜色”，“r”，“线型”，'：'，“线宽”2)传说(gn,“位置”，“东北”)举行从

图中包含一个轴对象。axis对象包含2个line类型的对象。这些物体代表男性，女性。

拟合核分布到分组数据

打开实时脚本

从数据文件中加载患者体重和性别patients.mat．

负载病人x =重量;

通过拟合数据来创建内核分布对象，并按患者性别分组。使用三角核函数。

[pdca,gn,gl] = fitdist(x，“内核”，“通过”、性别、“内核”，“三角形”）;

查看单元格数组中的每个分布pdca查看每个性别的内核分布。

女性= pdca{1}%女性分布

female = KernelDistribution内核= triangle带宽= 5.08961 Support = unbou金宝appnded

男性= pdca{2}男性百分比分布

male = KernelDistribution内核= triangle带宽= 4.25894 Support = unbou金宝appnded

计算每个分布的pdf。

X_values = 50:1:250;Femalepdf = pdf(female,x_values);Malepdf = pdf(male,x_values);

绘制pdf图，按性别进行体重分布的可视化比较。

图绘制(x_values femalepdf,“线宽”, 2)在情节(x_values malepdf,“颜色”，“r”，“线型”，'：'，“线宽”2)传说(gn,“位置”，“东北”)举行从

图中包含一个轴对象。axis对象包含2个line类型的对象。这些物体代表男性，女性。

输入参数

全部折叠

`x`- - - - - -输入数据
列向量

输入数据，指定为列向量。fitdist忽略了南值x．此外,任何南值在审查矢量或频率矢量引起fitdist中对应的值x．

数据类型:双

`distname`- - - - - -分布的名字
特征向量|字符串标量

分布名称，指定为以下字符向量或字符串标量之一。指定的分布。distname确定返回的概率分布对象的类型。

分布的名字	描述	分布对象
`“β”`	贝塔分布	`BetaDistribution`
`“二”`	二项分布	`BinomialDistribution`
`“BirnbaumSaunders”`	Birnbaum-Saunders分布	`BirnbaumSaundersDistribution`
`“毛刺”`	毛刺分布	`BurrDistribution`
`“指数”`	指数分布	`ExponentialDistribution`
`“极端值”`或`“电动汽车”`	极值分布	`ExtremeValueDistribution`
`“伽马”`	伽马分布	`GammaDistribution`
`“广义极值”`或`“gev”`	广义极值分布	`GeneralizedExtremeValueDistribution`
`广义帕累托的`或`“全科医生”`	广义帕累托分布	`GeneralizedParetoDistribution`
`“正常”的一半`或`“环”`	Half-normal分布	`HalfNormalDistribution`
`“InverseGaussian”`	逆高斯分布	`InverseGaussianDistribution`
`“内核”`	内核分配	`KernelDistribution`
`“物流”`	物流配送	`LogisticDistribution`
`“Loglogistic”`	Loglogistic分布	`LoglogisticDistribution`
`对数正态的`	对数正态分布	`LognormalDistribution`
`“Nakagami”`	Nakagami分布	`NakagamiDistribution`
`“负二项”`或`“nbin”`	负二项分布	`NegativeBinomialDistribution`
`“正常”`	正态分布	`NormalDistribution`
`“泊松”`	泊松分布	`PoissonDistribution`
`“瑞利”`	瑞利分布	`RayleighDistribution`
`“Rician”`	Rician分布	`RicianDistribution`
`“稳定”`	稳定分布	`StableDistribution`
`“tLocationScale”`	tLocation-Scale分布	`tLocationScaleDistribution`
`“威布尔”`或`“wbl”`	威布尔分布	`WeibullDistribution`

`groupvar`- - - - - -分组变量
分类数组|逻辑向量或数字向量|字符数组|字符串数组|字符向量的单元格数组

分组变量，指定为分类数组、逻辑或数字向量、字符数组、字符串数组或字符向量的单元格数组。分组变量中的每个惟一值定义一个组。

例如，如果性别单元格数组的字符向量与值“男”而且“女”，你可以使用性别作为分组变量，以按性别拟合数据的分布。

通过指定分组变量的单元格数组，可以使用多个分组变量。如果观察值的所有指定分组变量值相同，则将观察值放在同一组中。

例如，如果吸烟者逻辑向量有值吗0对于不吸烟者和1对于吸烟者，然后指定单元格数组{性别、吸烟}将观察结果分为四组:男性吸烟者、男性不吸烟者、女性吸烟者和女性不吸烟者。

例子:{性别、吸烟}

数据类型:分类|逻辑|单|双|字符|字符串|细胞

名称-值参数

的可选逗号分隔对名称,值参数。的名字参数名称和价值对应的值。的名字必须出现在引号内。您可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家．

例子:fitdist (x,“仁”,“仁”,“三角形”)中的数据适合内核分布对象x使用三角核函数。

`审查`- - - - - -删除数据的逻辑标志
`0`(默认)|逻辑值向量

截尾数据的逻辑标志，指定为与输入向量大小相同的逻辑值向量x．取值为1当相应的元素在x这是一个右删减的观察和0当对应的元素是精确观测时。默认值是的向量0S，表示所有的观测都是准确的。

fitdist忽略任何一个南这个审查向量中的值。此外,任何南值x或者频率矢量的原因fitdist忽略审查向量中的相应值。

这个论点只有在以下情况下才成立distname是“BirnbaumSaunders”，“毛刺”，“指数”，“ExtremeValue”，“伽马”，“InverseGaussian”，“内核”，“物流”，“Loglogistic”，对数正态的，“Nakagami”，“正常”，“Rician”，“tLocationScale”,或“威布尔”．

数据类型:逻辑

`频率`- - - - - -观察频率
`1`(默认)|非负整数值的向量

观测频率，指定为与输入向量大小相同的非负整数值向量x．频率向量的每个元素指定了中相应元素的频率x．默认值是的向量1S，表示中的每个值x只出现一次。

fitdist忽略任何一个南这个频率向量中的值。此外,任何南值x或者说是审查向量的原因fitdist忽略频率矢量中相应的值。

数据类型:单|双

`选项`- - - - - -控制参数
结构

迭代拟合算法的控制参数，指定为创建时使用的结构statset．

数据类型:结构体

`NTrials`- - - - - -二项分布的试验次数
1(默认)|正整数值

二项分布的试验次数，指定为正整数值。

此论点仅当distname是“二”(二项分布)。

例子:“Ntrials”,10

数据类型:单|双

`θ`- - - - - -广义帕累托分布的位置(阈值)参数
标量值

广义帕累托分布的位置(阈值)参数，指定为标量。

此论点仅当distname是广义帕累托的(广义Pareto分布)。

样例数据时默认值为0x只包含非负值。您必须指定θ如果x包括负值。

例子:“θ”,1

数据类型:单|双

`μ`- - - - - -半正态分布的位置参数
标量值

半正态分布的位置参数，指定为标量。

此论点仅当distname是“正常”的一半(half-normal分布)。

样例数据时默认值为0x只包含非负值。您必须指定μ如果x包括负值。

例子:“亩”,1

数据类型:单|双

`内核`- - - - - -用于内核分发的内核平滑类型
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`

内核分发的内核平滑类型，指定为以下之一:

“正常”
“盒子”
“三角形”
“epanechnikov”

您必须指定distname作为“内核”使用此选项。

`金宝app`- - - - - -内核密度支持内核分布金宝app
`“无限”`(默认)|`“积极”`|双元素向量

内核分布的内核密度支持，指定为金宝app“无限”，“积极”，或者一个二元向量。

价值	描述
`“无限”`	密度可以延伸到整条实线。
`“积极”`	密度限制在正值。

或者，您可以指定一个两元向量，为密度的支持提供有限的下限和上限。金宝app

您必须指定distname作为“内核”使用此选项。

数据类型:单|双|字符|字符串

`宽度`- - - - - -核分布的核平滑窗口带宽
标量值

核分布的核平滑窗口带宽，指定为标量值。的默认值fitdist是估计正态密度的最佳值，但您可能希望选择一个较小的值来显示多个模式等特征。您必须指定distname作为“内核”使用此选项。

数据类型:单|双

输出参数

全部折叠

`pd`-概率分布
概率分布对象

概率分布，作为概率分布对象返回。指定的分布。distname确定返回概率分布对象的类类型。有关的名单distname值和对应的概率分布对象，请参见distname．

`pdca`-概率分布对象
单元阵列

指定类型的概率分布对象distname，作为单元格数组返回。有关的名单distname值和对应的概率分布对象，请参见distname．

`gn`-组标签
字符向量的单元格数组

组标签，作为字符向量的单元格数组返回。

`gl`-将变量级别分组
字符向量的单元格数组

分组变量级别，作为包含每个分组变量一列的字符向量的单元格数组返回。

算法

的fitdist函数使用最大似然估计拟合大多数分布。两个例外是未删减数据的正态分布和对数正态分布。

对于无截尾正态分布，西格玛参数的估计值是方差无偏估计值的平方根。
对于无截尾对数正态分布，西格玛参数的估计值是数据对数方差的无偏估计值的平方根。

选择功能

的分布更健康App为您打开一个图形用户界面，以便从工作区导入数据，并交互式地为该数据拟合一个概率分布。然后，您可以将该分布作为概率分布对象保存到工作区。使用打开Distribution Fitter应用程序distributionFitter，或单击“应用程序”页签上的“分发检验器”。
要将分布拟合到左截尾、双截尾或间隔截尾数据，请使用大中型企业．您可以通过使用大中型企业函数创建一个概率分布对象makedist函数。有关示例，请参见查找双重审查数据的mle．

参考文献

[1]约翰逊，N. L.， S. Kotz, N. Balakrishnan。连续单变量分布．第1卷，霍博肯，新泽西州:Wiley-Interscience, 1993。

[2]约翰逊，N. L.， S. Kotz, N. Balakrishnan。连续单变量分布．卷2，霍博肯，新泽西州:Wiley-Interscience, 1994。

[3]鲍曼，a.w.和A.阿扎里尼。平滑技术在数据分析中的应用．纽约:牛津大学出版社，1997年。

扩展功能

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制:

金宝app支持的语法是:
```
pd= fitdist (x，distname）pd= fitdist (x，distname，名称,值）
```
代码生成不支持包含分组变量的语法金宝app“通过”,groupvar和相关的输出参数pdca，gn,gl．
fitdist金宝app支持beta、指数、极值、对数正态、正态和威布尔分布的代码生成。
- 的价值distname可以“β”，“指数”，“ExtremeValue”，对数正态的，“正常”或“威布尔”．
- 的价值distname必须是编译时常数。
的价值x，“审查”,“频率”不能包含南值。
代码生成忽略“频率”beta分布的值。而不是指定“频率”值，手动添加重复的值x所以这些值x有你想要的频率。
代码生成不支持以下输入参数:金宝appgroupvar，NTrials，θ，μ，内核，金宝app,宽度．
名-值对参数中的名称必须是编译时常量。
这些目标函数pd金宝app支持代码生成:提供，icdf，位差，的意思是，中位数，pdf，性病，截断,var．

有关代码生成的更多信息，请参见代码生成简介而且概率分布对象的代码生成．

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

使用注意事项和限制:

不能指定输入参数distname作为“Rician”或“稳定”．

有关更多信息，请参见在图形处理器上运行MATLAB函数(并行计算工具箱)．

另请参阅

主题

在R2009a中引入

fitdist

语法

描述

例子

拟合数据的正态分布

适合核分布到数据

拟合正态分布到分组数据

拟合核分布到分组数据

输入参数

`x`- - - - - -输入数据
列向量

`distname`- - - - - -分布的名字
特征向量|字符串标量

`groupvar`- - - - - -分组变量
分类数组|逻辑向量或数字向量|字符数组|字符串数组|字符向量的单元格数组

名称-值参数

`审查`- - - - - -删除数据的逻辑标志
`0`(默认)|逻辑值向量

`频率`- - - - - -观察频率
`1`(默认)|非负整数值的向量

`选项`- - - - - -控制参数
结构

`NTrials`- - - - - -二项分布的试验次数
1(默认)|正整数值

`θ`- - - - - -广义帕累托分布的位置(阈值)参数
标量值

`μ`- - - - - -半正态分布的位置参数
标量值

`内核`- - - - - -用于内核分发的内核平滑类型
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`

`金宝app`- - - - - -内核密度支持内核分布金宝app
`“无限”`(默认)|`“积极”`|双元素向量

`宽度`- - - - - -核分布的核平滑窗口带宽
标量值

输出参数

`pd`-概率分布
概率分布对象

`pdca`-概率分布对象
单元阵列

`gn`-组标签
字符向量的单元格数组

`gl`-将变量级别分组
字符向量的单元格数组

算法

选择功能

参考文献

扩展功能

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一步一步的MATLAB指南

fitdist

语法

描述

例子

拟合数据的正态分布

适合核分布到数据

拟合正态分布到分组数据

拟合核分布到分组数据

输入参数

x- - - - - -输入数据列向量

distname- - - - - -分布的名字特征向量|字符串标量

groupvar- - - - - -分组变量分类数组|逻辑向量或数字向量|字符数组|字符串数组|字符向量的单元格数组

名称-值参数

审查- - - - - -删除数据的逻辑标志0(默认)|逻辑值向量

频率- - - - - -观察频率1(默认)|非负整数值的向量

选项- - - - - -控制参数结构

NTrials- - - - - -二项分布的试验次数1(默认)|正整数值

θ- - - - - -广义帕累托分布的位置(阈值)参数标量值

μ- - - - - -半正态分布的位置参数标量值

内核- - - - - -用于内核分发的内核平滑类型“正常”(默认)|“盒子”|“三角形”|“epanechnikov”

金宝app- - - - - -内核密度支持内核分布金宝app“无限”(默认)|“积极”|双元素向量

宽度- - - - - -核分布的核平滑窗口带宽标量值

输出参数

pd-概率分布概率分布对象

pdca-概率分布对象单元阵列

gn-组标签字符向量的单元格数组

gl-将变量级别分组字符向量的单元格数组

算法

选择功能

参考文献

扩展功能

C/ c++代码生成使用MATLAB®Coder™生成C和c++代码。

GPU数组通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一步一步的MATLAB指南

`x`- - - - - -输入数据
列向量

`distname`- - - - - -分布的名字
特征向量|字符串标量

`groupvar`- - - - - -分组变量
分类数组|逻辑向量或数字向量|字符数组|字符串数组|字符向量的单元格数组

`审查`- - - - - -删除数据的逻辑标志
`0`(默认)|逻辑值向量

`频率`- - - - - -观察频率
`1`(默认)|非负整数值的向量

`选项`- - - - - -控制参数
结构

`NTrials`- - - - - -二项分布的试验次数
1(默认)|正整数值

`θ`- - - - - -广义帕累托分布的位置(阈值)参数
标量值

`μ`- - - - - -半正态分布的位置参数
标量值

`内核`- - - - - -用于内核分发的内核平滑类型
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`

`金宝app`- - - - - -内核密度支持内核分布金宝app
`“无限”`(默认)|`“积极”`|双元素向量

`宽度`- - - - - -核分布的核平滑窗口带宽
标量值

`pd`-概率分布
概率分布对象

`pdca`-概率分布对象
单元阵列

`gn`-组标签
字符向量的单元格数组

`gl`-将变量级别分组
字符向量的单元格数组

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。