fitdist

合适的概率分布对象的数据

所有的页面崩溃

语法

pd = fitdist (x, distname)

pd = fitdist (x, distname、名称、值)

(pdca gn, gl) = fitdist (x, distname‘由’,groupvar)

(pdca gn, gl) = fitdist (x, distname‘由’,groupvar,名称,值)

描述

例子

pd= fitdist (x,distname)创建一个概率分布对象由指定的分布distname数据的列向量x。

例子

pd= fitdist (x,distname,名称,值)创建概率分布对象与附加选项指定一个或多个名称-值对参数。例如,您可以显示数据审查或指定迭代匹配算法的控制参数。

例子

(pdca,gn,gl)= fitdist (x,distname“通过”,groupvar)创建概率分布对象由指定的分布distname的数据x基于分组变量groupvar。它返回一个合适的概率分布对象的单元阵列,pdca单元阵列的标签,gn和一个单元阵列分组变量的水平,gl。

例子

(pdca,gn,gl)= fitdist (x,distname“通过”,groupvar,名称,值)上面返回输出参数使用由一个或多个指定附加选项名称-值对参数。例如,您可以显示数据审查或指定迭代匹配算法的控制参数。

例子

全部折叠

符合正态分布的数据

打开生活的脚本

样本数据符合正态分布,研究适合利用直方图和quantile-quantile阴谋。

从数据文件加载病人体重patients.mat。

负载病人x =重量;

创建一个正态分布对象通过拟合数据。

pd = fitdist (x,“正常”)

pd = NormalDistribution正态分布μ= 154[148.728,159.272]σ= 26.5714 (23.3299,30.8674)

分布对象显示包括参数估计的意思(μ)和标准差(σ),和95%的置信区间参数。

您可以使用对象的功能pd评估分布和生成随机数。显示功能的支持对象。金宝app

方法(pd)

类问题的方法。NormalDistribution: cdf iqr negloglik proflik truncate gather mean paramci random var icdf median pdf std

例如,通过使用获得的95%的置信区间paramci函数。

ci95 = paramci (pd)

ci95 =2×2148.7277 23.3299 159.2723 30.8674

指定显著性水平(α)获得置信区间有不同的置信水平。计算99%置信区间。

ci99 = paramci (pd,“α”. 01)

ci99 =2×2147.0213 22.4257 160.9787 32.4182

评估和情节的pdf值分布。

x_values = 50:1:250;y = pdf (pd, x_values);情节(x_values, y)

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

创建一个直方图与正态分布符合使用histfit函数。histfit使用fitdist适合一个分布数据。

histfit (x)

图包含一个坐标轴对象。坐标轴对象包含2栏,类型的对象。

柱状图显示数据有两种模式,和正态分布的模式这两种模式之间。

使用qqplot创建一个quantile-quantile情节分位数的示例数据x与理论分位数的值拟合分布。

qqplot (x, pd)

图包含一个坐标轴对象。坐标轴对象与标题QQ的样本数据和分布包含3线类型的对象。

情节并不是一条直线,表明数据不服从正态分布。

内核的数据分布

打开生活的脚本

从数据文件加载病人体重patients.mat。

负载病人x =重量;

创建一个内核对象通过拟合的数据分布。使用Epanechnikov内核函数。

pd = fitdist (x,“内核”,“内核”,“epanechnikov”)

pd = KernelDistribution内核= = 14.3792支持=无限epanechnikov带宽金宝app

情节的pdf分布。

x_values = 50:1:250;y = pdf (pd, x_values);情节(x_values, y)

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

分组数据符合正态分布

打开生活的脚本

从数据文件加载病人体重和性别patients.mat。

负载病人x =重量;

创建正态分布对象通过拟合的数据,按病人性别分组。

(pdca gn, gl) = fitdist (x,“正常”,“通过”、性别)

pdca =1×2单元阵列{1 x1概率。x1 prob.NormalDistribution NormalDistribution} {1}

gn =2 x1细胞{“男性”}{‘女性’}

gl =2 x1细胞{“男性”}{‘女性’}

细胞数组pdca包含两个概率分布的对象,一个用于每个性别组。细胞数组gn包含两组标签。细胞数组gl包含两个集团的水平。

查看每个单元阵列的分布pdca比较的意思,μ和标准偏差,σ,按病人性别分组。

女= pdca {1}%分布雌性

女= NormalDistribution正态分布μ= 180.532[177.833,183.231]σ= 9.19322 (7.63933,11.5466)

男= pdca {2}%分布男性

男= NormalDistribution正态分布μ= 130.472[128.183,132.76]σ= 8.30339 (6.96947,10.2736)

计算每个分布的pdf。

x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);

情节的pdf视觉比较性别的重量分布。

图绘制(x_values femalepdf,“线宽”,2)在情节(x_values malepdf,“颜色”,“r”,“线型”,“:”,“线宽”2)传说(gn,“位置”,“东北”)举行从

图包含一个坐标轴对象。坐标轴对象包含2线类型的对象。这些对象代表男性,女性。

内核发行版适合分组数据

打开生活的脚本

从数据文件加载病人体重和性别patients.mat。

负载病人x =重量;

创建内核对象通过拟合的数据分布,按病人性别分组。使用一个三角形的内核函数。

(pdca gn, gl) = fitdist (x,“内核”,“通过”、性别、“内核”,“三角形”);

查看每个单元阵列的分布pdca每个性别的内核发行版。

女= pdca {1}%分布雌性

女= KernelDistribution内核=三角形带宽= 5.08961 =无限的支持金宝app

男= pdca {2}%分布男性

男= KernelDistribution内核=三角形带宽= 4.25894 =无限的支持金宝app

计算每个分布的pdf。

x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);

情节的pdf视觉比较性别的重量分布。

图绘制(x_values femalepdf,“线宽”,2)在情节(x_values malepdf,“颜色”,“r”,“线型”,“:”,“线宽”2)传说(gn,“位置”,“东北”)举行从

图包含一个坐标轴对象。坐标轴对象包含2线类型的对象。这些对象代表男性,女性。

输入参数

全部折叠

`x`- - - - - -输入数据
列向量

输入数据,指定为一个列向量。fitdist忽略了南值x。此外,任何南审查向量或频率向量中的值的原因fitdist忽略相应的值x。

数据类型:双

`distname`- - - - - -分布的名字
特征向量|字符串标量

分布的名字,指定为以下特征向量或字符串标量之一。指定的分布distname确定返回的概率分布对象的类型。

分布的名字	描述	分布对象
`“β”`	贝塔分布	`BetaDistribution`
`“二”`	二项分布	`BinomialDistribution`
`“BirnbaumSaunders”`	Birnbaum-Saunders分布	`BirnbaumSaundersDistribution`
`“毛刺”`	毛刺分布	`BurrDistribution`
`“指数”`	指数分布	`ExponentialDistribution`
`“极端值”`或`“电动汽车”`	极端值分布	`ExtremeValueDistribution`
`“伽马”`	伽马分布	`GammaDistribution`
`“广义极值”`或`“gev”`	广义极值分布	`GeneralizedExtremeValueDistribution`
`广义帕累托的`或`“全科医生”`	广义帕累托分布	`GeneralizedParetoDistribution`
`“正常”的一半`或`“环”`	Half-normal分布	`HalfNormalDistribution`
`“InverseGaussian”`	逆高斯分布	`InverseGaussianDistribution`
`“内核”`	内核分配	`KernelDistribution`
`“物流”`	物流配送	`LogisticDistribution`
`“Loglogistic”`	Loglogistic分布	`LoglogisticDistribution`
`对数正态的`	对数正态分布	`LognormalDistribution`
`“Nakagami”`	Nakagami分布	`NakagamiDistribution`
`“负二项”`或`“nbin”`	负二项分布	`NegativeBinomialDistribution`
`“正常”`	正态分布	`NormalDistribution`
`“泊松”`	泊松分布	`PoissonDistribution`
`“瑞利”`	瑞利分布	`RayleighDistribution`
`“Rician”`	Rician分布	`RicianDistribution`
`“稳定”`	稳定分布	`StableDistribution`
`“tLocationScale”`	tLocation-Scale分布	`tLocationScaleDistribution`
`“威布尔”`或`“wbl”`	威布尔分布	`WeibullDistribution`

`groupvar`- - - - - -分组变量
分类数组|逻辑或数值向量|字符数组|字符串数组|单元阵列的特征向量

分组变量,数组指定为一个分类、逻辑或数值向量,字符数组,字符串数组或单元阵列特征向量。每个分组变量定义了一组独特的价值。

例如,如果性别是一个单元阵列特征向量的值“男”和“女”,你可以使用性别作为分组变量符合性别分布数据。

可以使用多个分组变量指定一个单元阵列的分组变量。观察被放在同一组如果他们有所有指定的分组变量的共同价值观。

例如,如果吸烟者是一个逻辑向量和价值观0对于不吸烟者和1对于吸烟者,然后指定单元阵列{性别、吸烟}观察分为四组:男性吸烟者,男性不抽烟的人,女性吸烟者,女不抽烟的人。

例子:{性别、吸烟}

数据类型:分类|逻辑|单|双|字符|字符串|细胞

名称-值参数

指定可选的逗号分隔条名称,值参数。的名字参数名称和吗价值相应的价值。的名字必须出现在引号。您可以指定几个名称和值对参数在任何顺序Name1, Value1,…,的家。

例子:fitdist (x,“仁”,“仁”,“三角形”)适合一个内核分配对象中的数据x使用一个三角形的内核函数。

`审查`- - - - - -审查数据的逻辑信号
`0`(默认)|向量的逻辑值

审查数据的逻辑信号,指定为一个向量的逻辑值是相同的大小作为输入向量x。这个值是1当相应的元素x是right-censored观察和0当相应的元素是一个精确的观察。默认是一个向量的0年代,表明所有的观察都是恰当的。

fitdist忽略任何一个南这个审查向量中的值。此外,任何南值x或频率向量的原因fitdist忽略相应的审查向量中的值。

这个论点是有效的前提distname是“BirnbaumSaunders”,“毛刺”,“指数”,“ExtremeValue”,“伽马”,“InverseGaussian”,“内核”,“物流”,“Loglogistic”,对数正态的,“Nakagami”,“正常”,“Rician”,“tLocationScale”,或“威布尔”。

数据类型:逻辑

`频率`- - - - - -观察频率
`1`(默认)|向量的非负整数的值

观察频率,指定为一个向量的非负整数的值是相同的大小作为输入向量x。频率向量的每个元素指定的频率对应的元素x。默认是一个向量的1年代,表明每个值x只出现一次。

fitdist忽略任何一个南在这个频率值向量。此外,任何南值x或审查向量的原因fitdist忽略相应的频率向量中的值。

数据类型:单|双

`选项`- - - - - -控制参数
结构

迭代匹配算法的控制参数,指定为您创建一个结构使用statset。

数据类型:结构体

`NTrials`- - - - - -试验二项分布
1(默认)|正整数的值

二项分布的试验数量,指定为一个正整数的值。

这个论点是有效的只有当distname是“二”(二项分布)。

例子:“Ntrials”, 10

数据类型:单|双

`θ`- - - - - -为广义帕累托分布位置(阈值)参数
标量值

位置(阈值)为广义帕累托分布参数,指定为一个标量。

这个论点是有效的只有当distname是广义帕累托的(广义帕累托分布)。

样本数据的默认值是0x只包括非负价值。您必须指定θ如果x包括负值。

例子:“θ”,1

数据类型:单|双

`μ`- - - - - -位置参数half-normal分布
标量值

half-normal分布位置参数,指定为一个标量。

这个论点是有效的只有当distname是“正常”的一半(half-normal分布)。

样本数据的默认值是0x只包括非负价值。您必须指定μ如果x包括负值。

例子:“亩”,1

数据类型:单|双

`内核`- - - - - -内核为内核分布平滑类型
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`

内核平滑类型内核分配,指定为以下之一:

“正常”
“盒子”
“三角形”
“epanechnikov”

您必须指定distname作为“内核”使用这个选项。

`金宝app`- - - - - -内核支持内核分布密度金宝app
`“无限”`(默认)|`“积极”`|双元素向量

内核支持内核密度分布,指定为金宝app“无限”,“积极”或双元素向量。

价值	描述
`“无限”`	密度可以扩展到整个实线。
`“积极”`	密度是局限于积极的价值观。

此外,您可以指定一个双元素向量给有限的上下极限密度的支持。金宝app

您必须指定distname作为“内核”使用这个选项。

数据类型:单|双|字符|字符串

`宽度`- - - - - -内核平滑窗口内核分配的带宽
标量值

内核的带宽平滑窗口内核分配,指定为一个标量值。使用的默认值fitdist最佳估算正常密度,但您可能想要选择一个较小的值显示特性,比如多个模式。您必须指定distname作为“内核”使用这个选项。

数据类型:单|双

输出参数

全部折叠

`pd`——概率分布
概率分布对象

概率分布,作为一个概率分布对象返回。指定的分布distname确定返回的概率分布的类类型对象。的列表distname值和相应的概率分布对象,明白了distname。

`pdca`——概率分布对象
单元阵列

概率分布的对象指定的类型distname,作为一个细胞返回数组。的列表distname值和相应的概率分布对象,明白了distname。

`gn`——组标签
单元阵列的特征向量

组标签,作为特征向量的单元阵列返回。

`gl`——分组变量水平
单元阵列的特征向量

分组变量的水平,作为细胞返回数组的性格为每个分组变量向量包含一个列。

算法

的fitdist使用最大似然估计函数符合大多数发行版。两个例外与未经审查的数据是正常和对数正态分布。

未经审查的正态分布,估计σ值参数是根方差的无偏估计。
未经审查的对数正态分布,估计σ值参数无偏估计的方差的平方根的日志数据。

选择功能

的分布更健康应用程序打开一个图形用户界面从工作区导入数据,并交互式地对你适合这些数据的概率分布。然后您可以节省工作空间的分布作为概率分布对象。打开分布健康应用程序使用distributionFitter或单击应用程序选项卡上的分布更健康。
适合left-censored分布,double-censored,或结局数据,使用大中型企业。你可以找到使用的最大似然估计大中型企业概率分布函数,并创建一个对象使用makedist函数。例如,看到的找到毫升Double-Censored数据。

引用

[1]约翰逊:L。,S. Kotz, and N. Balakrishnan.连续单变量分布。1卷,霍博肯,新泽西:Wiley-Interscience, 1993年。

[2]约翰逊:L。,S. Kotz, and N. Balakrishnan.连续单变量分布。2卷,霍博肯,新泽西:Wiley-Interscience, 1994年。

[3]鲍曼,a·W。,A. Azzalini.应用平滑技术进行数据分析。纽约:牛津大学出版社,1997年版。

扩展功能

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

使用笔记和限制:

金宝app支持的语法是:
```
pd= fitdist (x,distname)pd= fitdist (x,distname,名称,值)
```
代码生成不支持语法,包括分组变量金宝app“通过”,groupvar和相关的输出参数pdca,gn,gl。
fitdist金宝app支持代码生成β、指数、极端值,对数正态,正常的,和威布尔分布。
- 的价值distname可以“β”,“指数”,“ExtremeValue”,对数正态的,“正常”或“威布尔”。
- 的价值distname必须是一个编译时常量。
的值x,“审查”,“频率”必须不包含南值。
代码生成忽略了“频率”β的值分布。而不是指定“频率”值,手动添加重复的值x这样的值x有你想要的频率。
代码生成不支持这些输入参数:金宝appgroupvar,NTrials,θ,μ,内核,金宝app,宽度。
名字必须编译时常量参数名称-值对。
这些对象的功能pd金宝app支持代码生成:提供,icdf,位差,的意思是,中位数,pdf,性病,截断,var。

代码生成的更多信息,请参阅介绍代码生成和概率分布对象的代码生成。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

使用笔记和限制:

你不能指定输入参数distname作为“Rician”或“稳定”。

有关更多信息,请参见运行在GPU MATLAB函数(并行计算工具箱)。

另请参阅

主题

介绍了R2009a

fitdist

语法

描述

例子

符合正态分布的数据

内核的数据分布

分组数据符合正态分布

内核发行版适合分组数据

输入参数

`x`- - - - - -输入数据
列向量

`distname`- - - - - -分布的名字
特征向量|字符串标量

`groupvar`- - - - - -分组变量
分类数组|逻辑或数值向量|字符数组|字符串数组|单元阵列的特征向量

名称-值参数

`审查`- - - - - -审查数据的逻辑信号
`0`(默认)|向量的逻辑值

`频率`- - - - - -观察频率
`1`(默认)|向量的非负整数的值

`选项`- - - - - -控制参数
结构

`NTrials`- - - - - -试验二项分布
1(默认)|正整数的值

`θ`- - - - - -为广义帕累托分布位置(阈值)参数
标量值

`μ`- - - - - -位置参数half-normal分布
标量值

`内核`- - - - - -内核为内核分布平滑类型
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`

`金宝app`- - - - - -内核支持内核分布密度金宝app
`“无限”`(默认)|`“积极”`|双元素向量

`宽度`- - - - - -内核平滑窗口内核分配的带宽
标量值

输出参数

`pd`——概率分布
概率分布对象

`pdca`——概率分布对象
单元阵列

`gn`——组标签
单元阵列的特征向量

`gl`——分组变量水平
单元阵列的特征向量

算法

选择功能

引用

扩展功能

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一个循序渐进的指导与MATLAB

fitdist

语法

描述

例子

符合正态分布的数据

内核的数据分布

分组数据符合正态分布

内核发行版适合分组数据

输入参数

x- - - - - -输入数据列向量

distname- - - - - -分布的名字特征向量|字符串标量

groupvar- - - - - -分组变量分类数组|逻辑或数值向量|字符数组|字符串数组|单元阵列的特征向量

名称-值参数

审查- - - - - -审查数据的逻辑信号0(默认)|向量的逻辑值

频率- - - - - -观察频率1(默认)|向量的非负整数的值

选项- - - - - -控制参数结构

NTrials- - - - - -试验二项分布1(默认)|正整数的值

θ- - - - - -为广义帕累托分布位置(阈值)参数标量值

μ- - - - - -位置参数half-normal分布标量值

内核- - - - - -内核为内核分布平滑类型“正常”(默认)|“盒子”|“三角形”|“epanechnikov”

金宝app- - - - - -内核支持内核分布密度金宝app“无限”(默认)|“积极”|双元素向量

宽度- - - - - -内核平滑窗口内核分配的带宽标量值

输出参数

pd——概率分布概率分布对象

pdca——概率分布对象单元阵列

gn——组标签单元阵列的特征向量

gl——分组变量水平单元阵列的特征向量

算法

选择功能

引用

扩展功能

C / c++代码生成生成C和c++代码使用MATLAB®编码器™。

GPU数组加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一个循序渐进的指导与MATLAB

`x`- - - - - -输入数据
列向量

`distname`- - - - - -分布的名字
特征向量|字符串标量

`groupvar`- - - - - -分组变量
分类数组|逻辑或数值向量|字符数组|字符串数组|单元阵列的特征向量

`审查`- - - - - -审查数据的逻辑信号
`0`(默认)|向量的逻辑值

`频率`- - - - - -观察频率
`1`(默认)|向量的非负整数的值

`选项`- - - - - -控制参数
结构

`NTrials`- - - - - -试验二项分布
1(默认)|正整数的值

`θ`- - - - - -为广义帕累托分布位置(阈值)参数
标量值

`μ`- - - - - -位置参数half-normal分布
标量值

`内核`- - - - - -内核为内核分布平滑类型
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`

`金宝app`- - - - - -内核支持内核分布密度金宝app
`“无限”`(默认)|`“积极”`|双元素向量

`宽度`- - - - - -内核平滑窗口内核分配的带宽
标量值

`pd`——概率分布
概率分布对象

`pdca`——概率分布对象
单元阵列

`gn`——组标签
单元阵列的特征向量

`gl`——分组变量水平
单元阵列的特征向量

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。