fitdist

拟合概率分布对象与数据

折叠所有页面

语法

pd = fitdist (x, distname)

pd = fitdist (x, distname、名称、值)

[pdca，gn，gl]=fitdist（x，地区名称，'By'，集团变量）

[pdca，gn，gl]=fitdist（x，distname，'By'，groupvar，Name，Value）

描述

例子

pd=fitdist(x，distname）通过拟合指定的分布，生成概率分布对象distname到列向量中的数据x．

例子

pd=fitdist(x，distname，名称、值）使用一个或多个名称-值对参数指定的其他选项创建概率分布对象。例如，您可以指示经过审查的数据或为迭代拟合算法指定控制参数。

例子

［pdca，gn，gl]=fitdist(x，distname","By",，群变）通过拟合指定的分布，生成概率分布对象distname将数据添加到x基于分组变量群变．它返回一个包含拟合概率分布对象的单元阵列，pdca，组标签的单元格数组，gn，以及分组可变级别的单元格数组，gl．

例子

［pdca，gn，gl]=fitdist(x，distname","By",，群变，名称、值）使用由一个或多个名称-值对参数指定的附加选项返回上述输出参数。例如，可以为迭代拟合算法指定审查数据或控制参数。

例子

全部崩溃

拟合数据的正态分布

打开实时脚本

对样本数据拟合正态分布，并使用直方图和分位数图检查拟合情况。

从数据文件加载患者权重病人垫．

负载病人x =重量;

通过将正态分布对象拟合到数据来创建正态分布对象。

pd=fitdist（x，“正常”）

pd=正态分布正态分布mu=154[148.728159.272]σ=26.5714[23.3299,30.8674]

分布对象显示包括平均值的参数估计(亩)及标准偏差(σ)，以及参数的95%置信区间。

的对象函数pd来评估分布并生成随机数。显示支持的对象函数。金宝app

方法(pd)

类概率正态分布的方法：cdf iqr negloglik proflik截断聚集平均参数随机变量icdf中值pdf标准

例如，通过使用帕拉姆奇函数。

ci95=参数CI（pd）

ci95 =2×2148.7277 23.3299 159.2723 30.8674

指定显著性水平(阿尔法)获取具有不同置信水平的置信区间。计算99%的置信区间。

ci99 = paramci (pd,“阿尔法”,.01)

ci99=2×2147.0213 22.4257 160.9787 32.4182

计算并绘制分布的pdf值。

x_值=50:1:250；y=pdf（pd，x_值）；绘图（x_值，y）

图中包含一个轴对象。axes对象包含类型为line的对象。

创建一个直方图与正态分布拟合使用histfit函数。histfit使用fitdist使分布适合数据。

histfit (x)

图中包含一个轴对象。axis对象包含两个类型为bar, line的对象。

直方图显示数据有两种模态，正态分布拟合的模态在这两种模态之间。

使用qqplot创建样本数据分位数的分位数图x相对于拟合分布的理论分位数值。

qqplot（x，pd）

图中包含一个轴对象。标题为QQ样本数据与分布图的坐标轴对象包含3个类型为line的对象。

曲线不是一条直线，说明数据不是正态分布。

使内核分布适合数据

打开实时脚本

从数据文件加载患者权重病人垫．

负载病人x =重量;

通过将内核分发对象与数据相匹配来创建它。使用Epanechnikov内核函数。

pd=fitdist（x，“内核”，“内核”，“epanechnikov”）

pd=KernelDistribution内核=epanechnikov带宽=14.3792支持度=无界金宝app

绘制分布图的pdf。

x_值=50:1:250；y=pdf（pd，x_值）；绘图（x_值，y）

图中包含一个轴对象。axes对象包含类型为line的对象。

拟合正态分布到分组数据

打开实时脚本

从数据文件加载患者体重和性别病人垫．

负载病人x =重量;

通过对数据进行拟合，创建正态分布对象，按患者性别分组。

(pdca gn, gl) = fitdist (x,“正常”，“由”，性别）

pdca =1×2单元阵列{1 x1概率。NormalDistribution} {1 x1概率。NormalDistribution}

gn =2x1电池{“男性”}{‘女性’}

gl =2x1电池{“男性”}{‘女性’}

细胞数组pdca包含两个概率分布对象，每个性别组一个。细胞数组gn包含两个组标签。细胞数组gl包含两个组级别。

查看单元格数组中的每个分布pdca要比较平均值，亩，标准差，σ，按病人性别分组。

女性=pdca{1}%女性分布情况

女性=正态分布正态分布mu=180.532[177.833183.231]西格玛=9.19322[7.63933,11.5466]

男= pdca {2}%男性的分布

男性=正态分布正态分布mu=130.472[128.183，132.76]西格玛=8.30339[6.96947，10.2736]

计算每个分发版的pdf。

x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);

绘制pdf文件以直观地比较性别的体重分布。

图绘制(x_values femalepdf,“线宽”, 2)在…上绘图（x_值，PDF，“颜色”，“r”，“线型”，':'，“线宽”2)传说(gn,“位置”，“东北”)持有关

图中包含一个轴对象。axes对象包含2个line类型的对象。这些物体代表男性和女性。

将核分布拟合到分组数据

打开实时脚本

从数据文件加载患者体重和性别病人垫．

负载病人x =重量;

通过将核心分布对象与按患者性别分组的数据相匹配来创建它们。使用三角核函数。

(pdca gn, gl) = fitdist (x,“内核”，“由”性别“内核”，“三角形”);

查看单元格数组中的每个分布pdca查看每种性别的内核发行版。

女性=pdca{1}%女性分布情况

女性=内核分布内核=三角形带宽=5.08961支持=无限金宝app

男= pdca {2}%男性的分布

男性=内核分布内核=三角形带宽=4.25894支持=无限金宝app

计算每个分发版的pdf。

x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);

绘制pdf文件以直观地比较性别的体重分布。

图绘制(x_values femalepdf,“线宽”, 2)在…上绘图（x_值，PDF，“颜色”，“r”，“线型”，':'，“线宽”2)传说(gn,“位置”，“东北”)持有关

图中包含一个轴对象。axes对象包含2个line类型的对象。这些物体代表男性和女性。

输入参数

全部崩溃

`x`- - - - - -输入数据
列向量

输入数据，指定为列向量。fitdist忽略了南价值观x.此外，任何南值在截尾矢量或频率矢量引起fitdist中对应的值忽略x．

数据类型：双

`distname`- - - - - -分发名称
特征向量|字符串标量

分布名称，指定为以下字符向量或字符串标量之一。由distname确定返回的概率分布对象的类型。

分发名称	描述	分布对象
`“贝塔”`	贝塔分布	`β分布`
`“二”`	二项分布	`BinomialDistribution`
`“BirnbaumSaunders”`	Birnbaum-Saunders分布	`伯恩鲍姆萨分布`
`“伯尔”`	毛刺分布	`BurrDistribution`
`“指数”`	指数分布	`指数分布`
`“极值”`或`“电动汽车”`	极值分布	`ExtremeValueDistribution`
`“伽马”`	伽马分布	`GammaDistribution`
`“广义极值”`或`“gev”`	广义极值分布	`广义右旋分布`
`广义帕累托的`或`“gp”`	广义帕累托分布	`广义分布`
`“半正常”`或`“嗯”`	Half-normal分布	`HalfNormalDistribution`
`“InverseGaussian”`	逆高斯分布	`逆高斯分布`
`“内核”`	内核分配	`KernelDistribution`
`“物流”`	物流配送	`LogisticDistribution`
`“后勤”`	Loglogistic分布	`LoglogisticDistribution`
`对数正态的`	对数正态分布	`对数正态分布`
`“中谷”`	中川分布	`NakagamiDistribution`
`“负二项”`或`“nbin”`	负二项分布	`NegativeBinomialDistribution`
`“正常”`	正态分布	`常态分配`
`“泊松”`	泊松分布	`泊松分布`
`“瑞利”`	瑞利分布	`RayleighDistribution`
`“Rician”`	蓖麻分布	`分布`
`“稳定”`	稳定分布	`StableDistribution`
`“tLocationScale”`	tLocation-Scale分布	`tLocationScaleDistribution`
`“威布尔”`或`“wbl”`	威布尔分布	`WeibullDistribution`

`群变`- - - - - -分组变量
分类数组|逻辑或数字向量|字符数组|字符串数组|字符向量单元数组

分组变量，指定为分类数组、逻辑或数字向量、字符数组、字符串数组或字符向量的单元格数组。分组变量中的每个唯一值定义一个组。

例如,如果性别字符向量的单元格数组有值吗“男性”和“女性”，你可以使用性别作为分组变量，以符合你的数据的性别分布。

通过指定分组变量的单元格数组，可以使用多个分组变量。如果观测值具有所有指定分组变量的公共值，则将它们放置在同一组中。

例如,如果吸烟者是具有值的逻辑向量0对于不吸烟者和1对于吸烟者，则指定单元格数组{性别，吸烟者}将观察分为四组：男性吸烟者、男性不吸烟者、女性吸烟者和女性不吸烟者。

例子:{性别，吸烟者}

数据类型：分类|逻辑|仅有一个的|双|字符|一串|单间牢房

名称-值参数

指定可选的逗号分隔的对名称、值参数。名称参数名和价值是对应的值。名称必须出现在引号内。您可以按任意顺序指定多个名称和值对参数，如下所示：Name1, Value1,…,的家．

例子:fitdist（x，'Kernel'，'Kernel'，'triangle'）中的数据拟合内核分布对象x用三角核函数。

`审查`- - - - - -删失数据的逻辑标志
`0`（默认）|逻辑值向量

审查数据的逻辑标志，指定为与输入向量大小相同的逻辑值向量x. 价值是1当相应的元素x这是一个经过右删失的观察结果0当对应的元素是一个精确的观测值时。默认值是一个向量0S，表明所有的观测结果都是准确的。

fitdist忽略任何南此审查向量中的值。此外，任何南价值观x或者是频率矢量引起的fitdist忽略截尾向量中的相应值。

此参数仅在以下情况下有效：distname是“BirnbaumSaunders”，“伯尔”，“指数”，“极端价值”，“伽马”，“InverseGaussian”，“内核”，“物流”，“后勤”，对数正态的，“中谷”，“正常”，“Rician”，“tLocationScale”或“威布尔”．

数据类型：逻辑

`频率`- - - - - -观察频率
`1`（默认）|非负整数值向量

观察频率，指定为与输入向量大小相同的非负整数值向量x. 频率向量的每个元素指定中对应元素的频率x. 默认值是一个向量1S，表示中每个值x只出现一次。

fitdist忽略任何南此频率向量中的值。此外，任何南价值观x或者是截尾矢量原因fitdist忽略频率向量中的相应值。

数据类型：仅有一个的|双

`选择权`- - - - - -控制参数
结构

迭代拟合算法的控制参数，指定为使用statset．

数据类型：结构

`中心线`- - - - - -二项分布的试验次数
1（默认）|正整数值

二项分布的试验次数，指定为正整数值。

此参数仅在以下情况下有效：distname是“二”（二项分布）。

例子:“Ntrials”，10

数据类型：仅有一个的|双

`θ`- - - - - -广义Pareto分布的位置（阈值）参数
标量值

广义帕累托分布的位置(阈值)参数，指定为标量。

此参数仅在以下情况下有效：distname是广义帕累托的（广义帕累托分布）。

当样本数据时默认值为0x仅包括非负值。您必须指定θ如果x包括负值。

例子:“theta”，1

数据类型：仅有一个的|双

`亩`- - - - - -半正态分布的位置参数
标量值

作为标量指定的半正态分布的位置参数。

此参数仅在以下情况下有效：distname是“半正常”(half-normal分布)。

当样本数据时默认值为0x仅包括非负值。您必须指定亩如果x包括负值。

例子:"木",1

数据类型：仅有一个的|双

`内核`- - - - - -核分布的核平滑器类型
`“正常”`（默认）|`“盒子”`|`“三角形”`|`“epanechnikov”`

Kernel smooth类型用于内核分布，指定为如下之一:

“正常”
“盒子”
“三角形”
“epanechnikov”

您必须指定distname作为“内核”使用此选项。

`金宝app`- - - - - -内核分布的内核密度支持金宝app
`“无限的”`（默认）|`“肯定的”`|二元向量

内核分布的内核密度支持，指定为金宝app“无限的”，“肯定的”，或双元素向量。

价值	描述
`“无限的”`	密度可以延伸到整条实线。
`“肯定的”`	密度限制为正值。

或者，您可以指定一个二元向量，为密度的支持提供有限的下限和上限。金宝app

您必须指定distname作为“内核”使用此选项。

数据类型：仅有一个的|双|字符|一串

`宽度`- - - - - -核分布平滑窗的带宽
标量值

内核分布的内核平滑窗口的带宽，指定为标量值。默认值由fitdist对于估计正常密度是最佳的，但您可能希望选择较小的值来显示特征，例如多个模式。您必须指定distname作为“内核”使用此选项。

数据类型：仅有一个的|双

输出参数

全部崩溃

`pd`-概率分布
概率分布对象

概率分布，作为概率分布对象返回。由distname确定返回的概率分布对象的类类型。有关distname值和对应的概率分布对象，见distname．

`pdca`-概率分布对象
单元阵列

所指定类型的概率分布对象distname，作为单元格数组返回。有关distname值和对应的概率分布对象，见distname．

`gn`-组标签
字符向量单元数组

组标签，作为字符向量的单元格数组返回。

`gl`-分组可变级别
字符向量单元数组

分组变量级别，返回为字符向量的单元格数组，其中每个分组变量包含一列。

算法

的fitdist函数使用最大似然估计拟合大多数分布。两个例外情况是未经审查数据的正态分布和对数正态分布。

对于无偏正态分布，σ参数的估计值是方差无偏估计的平方根。
对于未经检验的对数正态分布，西格玛参数的估计值是数据对数方差无偏估计的平方根。

替代功能

的分配装配工应用程序打开一个图形用户界面，供您从工作区导入数据，并以交互方式将概率分布拟合到该数据。然后，您可以将概率分布保存到工作区作为概率分布对象。使用distributionFitter，或单击“应用程序”选项卡上的“分发安装程序”。
若要拟合左截、双截或间隔截数据的分布，请使用最大似然误差。您可以使用最大似然误差函数，并使用制造者函数。例如，请参见求双截尾数据的MLEs．

参考文献

[1] 约翰逊，N.L.，S.Kotz和N.Balakrishnan。连续单变量分布第1卷，新泽西州霍博肯：威利国际科学出版社，1993年。

[2] 约翰逊，N.L.，S.Kotz和N.Balakrishnan。连续单变量分布．第2卷，霍博肯，新泽西州:威利-国际科学，1994。

[3] 鲍曼、A.W.和A.Azzalini。数据分析中应用的平滑技术．纽约:牛津大学出版社，1997。

扩展能力

C / c++代码生成
使用Matlab®编码器生成C和C++代码™.

使用注意事项及限制:

金宝app支持的语法包括：
```
pd=fitdist(x，distname）pd=fitdist(x，distname，名称、值）
```
代码生成不支持包含分组变量的语法金宝app“通过”,groupvar以及相关的输出参数pdca，gn和gl．
fitdist金宝app支持生成beta、指数、极值、对数正态、正态和Weibull分布的代码。
- 价值distname可以“贝塔”，“指数”，“极端价值”，对数正态的，“正常”或“威布尔”．
- 价值distname必须是编译时常量。
的值x，“审查”和“频率”不得包含南价值观
代码生成忽略“频率”beta分布的值。而不是指定“频率”值，手动添加重复值x所以值在里面x有你想要的频率。
代码生成不支持以下输入参数：金宝app群变，中心线，西塔，亩，内核，金宝app和宽度．
名称-值对参数中的名称必须是编译时常量。
这些目标函数pd金宝app支持代码生成:提供，icdf，位差，的意思是，中值的，pdf，性病，截断和var．

有关代码生成的更多信息，请参见代码生成简介和概率分布对象的代码生成．

GPU阵列
通过使用并行计算工具箱在图形处理单元（GPU）上运行来加速代码™.

使用注意事项及限制:

您不能指定输入参数distname作为“Rician”或“稳定”．

有关更多信息，请参见在GPU上运行MATLAB函数（并行计算工具箱）．

另请参阅

主题

介绍了R2009a

fitdist

语法

描述

例子

拟合数据的正态分布

使内核分布适合数据

拟合正态分布到分组数据

将核分布拟合到分组数据

输入参数

`x`- - - - - -输入数据
列向量

`distname`- - - - - -分发名称
特征向量|字符串标量

`群变`- - - - - -分组变量
分类数组|逻辑或数字向量|字符数组|字符串数组|字符向量单元数组

名称-值参数

`审查`- - - - - -删失数据的逻辑标志
`0`（默认）|逻辑值向量

`频率`- - - - - -观察频率
`1`（默认）|非负整数值向量

`选择权`- - - - - -控制参数
结构

`中心线`- - - - - -二项分布的试验次数
1（默认）|正整数值

`θ`- - - - - -广义Pareto分布的位置（阈值）参数
标量值

`亩`- - - - - -半正态分布的位置参数
标量值

`内核`- - - - - -核分布的核平滑器类型
`“正常”`（默认）|`“盒子”`|`“三角形”`|`“epanechnikov”`

`金宝app`- - - - - -内核分布的内核密度支持金宝app
`“无限的”`（默认）|`“肯定的”`|二元向量

`宽度`- - - - - -核分布平滑窗的带宽
标量值

输出参数

`pd`-概率分布
概率分布对象

`pdca`-概率分布对象
单元阵列

`gn`-组标签
字符向量单元数组

`gl`-分组可变级别
字符向量单元数组

算法

替代功能

参考文献

扩展能力

C / c++代码生成
使用Matlab®编码器生成C和C++代码™.

GPU阵列
通过使用并行计算工具箱在图形处理单元（GPU）上运行来加速代码™.

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一步一步的指导与MATLAB

fitdist

语法

描述

例子

拟合数据的正态分布

使内核分布适合数据

拟合正态分布到分组数据

将核分布拟合到分组数据

输入参数

x- - - - - -输入数据列向量

distname- - - - - -分发名称特征向量|字符串标量

群变- - - - - -分组变量分类数组|逻辑或数字向量|字符数组|字符串数组|字符向量单元数组

名称-值参数

审查- - - - - -删失数据的逻辑标志0（默认）|逻辑值向量

频率- - - - - -观察频率1（默认）|非负整数值向量

选择权- - - - - -控制参数结构

中心线- - - - - -二项分布的试验次数1（默认）|正整数值

θ- - - - - -广义Pareto分布的位置（阈值）参数标量值

亩- - - - - -半正态分布的位置参数标量值

内核- - - - - -核分布的核平滑器类型“正常”（默认）|“盒子”|“三角形”|“epanechnikov”

金宝app- - - - - -内核分布的内核密度支持金宝app“无限的”（默认）|“肯定的”|二元向量

宽度- - - - - -核分布平滑窗的带宽标量值

输出参数

pd-概率分布概率分布对象

pdca-概率分布对象单元阵列

gn-组标签字符向量单元数组

gl-分组可变级别字符向量单元数组

算法

替代功能

参考文献

扩展能力

C / c++代码生成使用Matlab®编码器生成C和C++代码™.

GPU阵列通过使用并行计算工具箱在图形处理单元（GPU）上运行来加速代码™.

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一步一步的指导与MATLAB

`x`- - - - - -输入数据
列向量

`distname`- - - - - -分发名称
特征向量|字符串标量

`群变`- - - - - -分组变量
分类数组|逻辑或数字向量|字符数组|字符串数组|字符向量单元数组

`审查`- - - - - -删失数据的逻辑标志
`0`（默认）|逻辑值向量

`频率`- - - - - -观察频率
`1`（默认）|非负整数值向量

`选择权`- - - - - -控制参数
结构

`中心线`- - - - - -二项分布的试验次数
1（默认）|正整数值

`θ`- - - - - -广义Pareto分布的位置（阈值）参数
标量值

`亩`- - - - - -半正态分布的位置参数
标量值

`内核`- - - - - -核分布的核平滑器类型
`“正常”`（默认）|`“盒子”`|`“三角形”`|`“epanechnikov”`

`金宝app`- - - - - -内核分布的内核密度支持金宝app
`“无限的”`（默认）|`“肯定的”`|二元向量

`宽度`- - - - - -核分布平滑窗的带宽
标量值

`pd`-概率分布
概率分布对象

`pdca`-概率分布对象
单元阵列

`gn`-组标签
字符向量单元数组

`gl`-分组可变级别
字符向量单元数组

C / c++代码生成
使用Matlab®编码器生成C和C++代码™.

GPU阵列
通过使用并行计算工具箱在图形处理单元（GPU）上运行来加速代码™.