fitdist

拟合概率分布对象数据

折叠所有页面

句法

PD = fitdist（X，DISTNAME）

PD = fitdist（X，DISTNAME，名称，值）

[PDCA，GN，GL = fitdist（X，DISTNAME， '通过'，组变量）

[PDCA，GN，GL = fitdist（X，DISTNAME， '通过'，组变量，名称，值）

描述

例

PD= fitdist（X，DISTNAME）通过拟合通过指定的分发创建一个概率分布对象DISTNAME在列向量的数据X。

例

PD= fitdist（X，DISTNAME，名称，值）创建具有由一个或多个名称值对参数中指定的附加选项的概率分布的对象。例如，您可以指示截尾数据或迭代拟合算法指定的控制参数。

例

[PDCA，GN，GL] = fitdist（X，DISTNAME，'通过'，组变量）通过拟合通过指定的分布创建概率分布的对象DISTNAME在数据X基于分组变量组变量。它返回配概率分布的对象的单元阵列，PDCA，组标签的单元阵列，GN和分组可变水平的单元阵列，GL。

例

[PDCA，GN，GL] = fitdist（X，DISTNAME，'通过'，组变量，名称，值）返回使用由一个或多个名称值对参数中指定的附加选项上述输出参数。例如，您可以指示截尾数据或迭代拟合算法指定的控制参数。

例子

全部收缩

适合正常分布数据

开立真实脚本

加载样本数据。创建包含患者的重量数据的矢量。

加载医院X = hospital.Weight;

由它拟合的数据来创建一个正常的分布对象。

PD = fitdist（X，'正常'）

PD =正态分布正态分布亩= 154 [148.728，159.272]西格玛= 26.5714 [23.3299，30.8674]

旁边的参数估计值的时间间隔是分布参数的95％置信区间。

绘制分布的PDF文件。

x_values = 50：1：250;Y = PDF（PD，x_values）;图（x_values，Y，'行宽'，2）

安装一个内核分配到数据

开立真实脚本

加载样本数据。创建包含患者的重量数据的矢量。

加载医院X = hospital.Weight;

由它拟合的数据来创建一个内核分配对象。使用Epanechnikov内核函数。

PD = fitdist（X，'核心'，'核心'，'epanechnikov'）

PD = KernelDistribution内核= epanechnikov带宽= 14.3792夹持=无界金宝app

绘制分布的PDF文件。

x_values = 50：1：250;Y = PDF（PD，x_values）;情节（x_values，y）的

适合正态分布应用于分组数据

开立真实脚本

加载样本数据。创建包含患者的重量数据的矢量。

加载医院X = hospital.Weight;

他们拟合数据，按患者性别分组创建正态分布的对象。

性别= hospital.Sex;[PDCA，GN，GL = fitdist（X，'正常'，'通过'，性别）

PDCA =1×2细胞{的1x1 prob.NormalDistribution} {的1x1 prob.NormalDistribution}

GN =2×1单元阵列{'女人男人' }

GL =2×1单元阵列{'女人男人' }

单元阵列PDCA包含两个概率分布的目的，一个用于每个性别组。单元阵列GN包含两个组标签。单元阵列GL包含两个组的水平。

查看在单元阵列中每个分布PDCA比较平均，亩和标准偏差，西格玛，按患者性别分组。

女= PDCA {1}％分布为女性

女=正态分布正态分布亩= 130.472 [128.183，132.76]标准差= 8.30339 [6.96947，10.2736]

雄性= PDCA {2}％分布为男性

雄性=正态分布正态分布亩= 180.532 [177.833，183.231]标准差= 9.19322 [7.63933，11.5466]

计算每个分布的PDF文件。

x_values = 50：1：250;femalepdf = PDF（雌性，x_values）;malepdf = PDF（雄性，x_values）;

绘制PDF文件按性别重量分布的视觉比较。

图图（x_values，femalepdf，'行宽'2）保持上图（x_values，malepdf，'颜色'，'R'，'的LineStyle'，'：'，'行宽'，2）图例（GN，'位置'，'东北'）保持离

飞度内核发行应用于分组数据

开立真实脚本

加载样本数据。创建包含患者的重量数据的矢量。

加载医院X = hospital.Weight;

他们拟合数据，按患者性别分组创建内核分配对象。使用三角核函数。

性别= hospital.Sex;[PDCA，GN，GL = fitdist（X，'核心'，'通过'，性别，'核心'，'三角形'）;

查看在单元阵列中每个分布PDCA看到每个性别的核心分布。

女= PDCA {1}％分布为女性

女= KernelDistribution内核=三角形带宽= 4.25894支持=无界金宝app

雄性= PDCA {2}％分布为男性

雄性= KernelDistribution内核=三角形带宽= 5.08961支持=无界金宝app

计算每个分布的PDF文件。

x_values = 50：1：250;femalepdf = PDF（雌性，x_values）;malepdf = PDF（雄性，x_values）;

绘制PDF文件按性别重量分布的视觉比较。

图图（x_values，femalepdf，'行宽'2）保持上图（x_values，malepdf，'颜色'，'R'，'的LineStyle'，'：'，'行宽'，2）图例（GN，'位置'，'东北'）保持离

输入参数

全部收缩

`X`-输入数据
列向量

输入数据，指定为列向量。fitdist忽略为NaN价值观X。此外，任何为NaN在审查载体或频率向量原因值fitdist忽略对应的值X。

数据类型：双

`DISTNAME`-分布名
特征向量|串标

分配名称，指定为下面的特征向量或标量的字符串中的一个。由指定的分布DISTNAME确定返回的概率分布的对象的类型。

分布名称	描述	分销对象
`“测试版”`	贝塔分布	`BetaDistribution`
`“二项式”`	二项分布	`二项分布`
`'BirnbaumSaunders'`	伯恩鲍姆 - 桑德斯分布	`BirnbaumSaundersDistribution`
`“毛刺”`	伯尔分布	`BurrDistribution`
`“指数”`	指数分布	`ExponentialDistribution`
`'ExtremeValue'`	极值分布	`ExtremeValueDistribution`
`“伽马”`	Gamma分布	`伽玛分布`
`'GeneralizedExtremeValue'`	广义极值分布	`GeneralizedExtremeValueDistribution`
`'GeneralizedPareto'`	广义帕累托分布	`GeneralizedParetoDistribution`
`'HalfNormal'`	半正态分布	`HalfNormalDistribution`
`'InverseGaussian'`	逆高斯分布	`InverseGaussianDistribution`
`'核心'`	内核分配	`KernelDistribution`
`“物流”`	物流配送	`LogisticDistribution`
`'Loglogistic'`	Loglogistic分布	`LoglogisticDistribution`
`“对数正态分布”`	对数正态分布	`LognormalDistribution`
`“中上”`	中上分布	`NakagamiDistribution`
`'NegativeBinomial'`	负二项分布	`NegativeBinomialDistribution`
`'正常'`	正态分布	`正态分布`
`“泊松`	泊松分布	`泊松分布`
`“瑞利”`	瑞利分布	`瑞利分布`
`“莱斯”`	莱斯分布	`RicianDistribution`
`'稳定'`	稳定分布	`StableDistribution`
`'tLocationScale'`	Ť位置尺度分布	`tLocationScaleDistribution`
`“韦伯”`	威布尔分布	`韦伯分布`

`组变量`-分组变量
分类数组|逻辑或数字矢量|字符数组|字符串数组|字符向量的单元阵列

分组变量，指定为分类阵列，逻辑或数字向量，字符数组，字符串数组，或字符向量的单元阵列。在一个分组变量的每个唯一值定义的基团。

例如，如果性别是字符向量的单元阵列与值'男'和'女'，您可以使用性别作为分组变量，以适应按性别分配给您的数据。

多于一个的分组变量可以通过指定分组变量的单元阵列被使用。观察被放置在同一个组，如果他们有所有指定分组变量的共同价值观。

例如，如果抽烟者是具有值的逻辑矢量0对于非吸烟者和1为吸烟者，则指定单元阵列{性别，吸烟者}分歧意见分为四组：男性吸烟者，不吸烟男性，女性吸烟者和不吸烟女性。

例：{性别，吸烟者}

数据类型：明确的|合乎逻辑|单|双|烧焦|串|细胞

名称 - 值对参数

指定可选的用逗号分隔的对名称，值参数。名称是参数的名称和值是对应的值。名称必须出现引号内。您可以按照任何顺序指定多个名称和值对参数名1，值1，...，NameN，值N。

例：fitdist（X， '内核'， '核心'， '三角形'）适合内核分配对象的数据X使用三角核函数。

`“截尾”`-截尾数据逻辑标志
`0`（默认）|逻辑值的矢量

逻辑标志截尾数据，指定为逗号分隔的一对组成的“截尾”和逻辑值的矢量，其大小作为输入矢量同X。该值是1当在相应的元件X是右删失观察0当相应的元件是一种精确的观察。默认值是一个矢量0S，这表明所有观察是准确的。

fitdist忽略任何为NaN值在该截尾矢量。此外，任何为NaN价值观X或频矢量原因fitdist忽略在截尾矢量对应的值。

这种观点仅仅当DISTNAME是'BirnbaumSaunders'，“毛刺”，“指数”，'ExtremeValue'，“伽马”，'InverseGaussian'，'核心'，“物流”，'Loglogistic'，“对数正态分布”，“中上”，'正常'，“莱斯”，'tLocationScale'，要么“韦伯”。

数据类型：合乎逻辑

`'频率'`-观测频率
`1`（默认）|非负整数值的矢量

观测频率，指定为逗号分隔的一对组成的'频率'和非负整数的值的矢量，其大小作为输入矢量同X。频率向量的每个元素指定在相应的元件的频率X。默认值是一个矢量1S，这表明在每个值X只出现一次。

fitdist忽略任何为NaN值在这个频率矢量。此外，任何为NaN价值观X或截尾矢量原因fitdist忽略在频矢量对应的值。

数据类型：单|双

`“选项”`-控制参数
结构体

对于迭代拟合算法的控制参数，指定为逗号分隔的一对组成的“选项”与您共创结构使用statset。

数据类型：结构

`'NTrials'`-试验次数
正整数值

为二项式分布试验次数，指定为逗号分隔的一对组成的'NTrials'和正整数值。您必须指定DISTNAME如“二项式”使用这个选项。

数据类型：单|双

`“西塔”`-阈值参数
`0`（默认）|标值

阈值参数为广义Pareto分布，指定为逗号分隔的一对组成的“西塔”和标量值。您必须指定DISTNAME如'GeneralizedPareto'使用这个选项。

数据类型：单|双

`'亩'`-位置参数
0（默认）|标值

对于半正态分布位置参数，指定为逗号分隔的一对组成的'亩'和标量值。您必须指定DISTNAME如'HalfNormal'使用这个选项。

数据类型：单|双

`'核心'`-核平滑型
`'正常'`（默认）|`'框'`|`'三角形'`|`'epanechnikov'`

内核平滑型，指定为逗号分隔的一对组成的'核心'和以下情况之一：

'正常'
'框'
'三角形'
'epanechnikov'

您必须指定DISTNAME如'核心'使用这个选项。

`'金宝app支持'`-核密度支持金宝app
`“无界”`（默认）|`'正'`|二元素矢量

核密度支撑，指定为逗号分隔的一金宝app对组成的'金宝app支持'和“无界”，'正'或两个元素的矢量。

`“无界”`	密度可以扩展到整个实线。
`'正'`	密度被限制为正值。

可替换地，可以指定有限的下限和上限给予用于支撑密度的两元素向量。金宝app

您必须指定DISTNAME如'核心'使用这个选项。

数据类型：单|双|烧焦|串

`'宽度'`-核平滑窗口的带宽
标值

内核平滑窗口的带宽，指定为逗号分隔的一对组成的'宽度'和标量值。通过使用缺省值fitdist是最佳估计正常密度，但你可能想选择一个更小的值来揭示功能，如多模式。您必须指定DISTNAME如'核心'使用这个选项。

数据类型：单|双

输出参数

全部收缩

`PD`- 概率分布
概率分布对象

概率分布，返回一个概率分布对象。由指定的分布DISTNAME确定类别类型返回的概率分布的对象。

`PDCA`- 概率分布对象
单元阵列

由指定类型的概率分布对象DISTNAME，返回为单元阵列。

`GN`- 组标签
字符向量的单元阵列

组标签，返回作为字符向量的单元阵列。

`GL`- 分组变量水平
字符向量的单元阵列

分组变量水平，返回包含每个分组变量的一列字符向量的单元阵列。

算法

该fitdist功能适合使用最大似然估计大多数发行。两个例外是与未经审查数据正常和对数正态分布。

对于未经审查的正态分布，估计值西格玛参数的是方差的无偏估计的平方根。
对于未经审查的对数正态分布，该估计值西格玛参数的是日志数据的方差的无偏估计的平方根。

另类功能

应用

该分布钳工应用打开了一个图形用户界面，让你从工作区导入数据，并以交互方式拟合概率分布数据。然后，您可以保存分配到工作区的概率分布对象。采用开放式分布钳工应用distributionFitter，或单击应用程序选项卡上的分布钳工。

参考

[1]约翰逊，N. L.，S.科茨和N维文。连续单变量分布。卷。1，Hoboken的，NJ：WILEY-INTERSCIENCE，1993。

[2]约翰逊，N. L.，S.科茨和N维文。连续单变量分布。卷。2，Hoboken的，NJ：WILEY-INTERSCIENCE，1994。

[3]鲍曼，A. W.，和A. Azzalini。应用平滑技术数据分析。纽约：牛津大学出版社，1997年。

扩展功能

C / C ++代码生成
生成使用MATLAB®编码器™C和C ++代码。

使用注意事项和限制：

金宝app支持的语法有：
```
PD= fitdist（X，DISTNAME）PD= fitdist（X，DISTNAME，名称，值）
```
代码生成不支持包括分组变量的语法金宝app“通过”，组变量以及相关的输出参数PDCA，GN和GL。
fitdist金宝app支持代码生成的β为，指数，极值，对数正态分布，正常和威布尔分布。
- 的价值DISTNAME可“测试版”，“指数”，'ExtremeValue'，“对数正态分布”，'正常'要么“韦伯”。
- 的价值DISTNAME必须是一个编译时间常数。
值X，“截尾”和'频率'不得含有为NaN值。
代码生成忽略'频率'为β分布的值。不是指定的'频率'值，手动添加复制的值，以X所以，在值X有你想要的频率。
代码生成不支持这些输入参数：金宝app组变量，NTrials，西塔，亩，核心，金宝app和宽度。
在名称 - 值对参数的名称必须是编译时间常数。
这些目标函数PD金宝app支持代码生成：CDF，ICDF，IQR，意思，中位数，PDF格式，STD，截短和VAR。

有关代码生成的更多信息，请参阅介绍代码生成和代码生成的概率分布对象。

也可以看看

distributionFitter|histfit|makedist|MLE|paramci

fitdist

句法

描述

例子

适合正常分布数据

安装一个内核分配到数据

适合正态分布应用于分组数据

飞度内核发行应用于分组数据

输入参数

`X`-输入数据
列向量

`DISTNAME`-分布名
特征向量|串标

`组变量`-分组变量
分类数组|逻辑或数字矢量|字符数组|字符串数组|字符向量的单元阵列

名称 - 值对参数

`“截尾”`-截尾数据逻辑标志
`0`（默认）|逻辑值的矢量

`'频率'`-观测频率
`1`（默认）|非负整数值的矢量

`“选项”`-控制参数
结构体

`'NTrials'`-试验次数
正整数值

`“西塔”`-阈值参数
`0`（默认）|标值

`'亩'`-位置参数
0（默认）|标值

`'核心'`-核平滑型
`'正常'`（默认）|`'框'`|`'三角形'`|`'epanechnikov'`

`'金宝app支持'`-核密度支持金宝app
`“无界”`（默认）|`'正'`|二元素矢量

`'宽度'`-核平滑窗口的带宽
标值

输出参数

`PD`- 概率分布
概率分布对象

`PDCA`- 概率分布对象
单元阵列

`GN`- 组标签
字符向量的单元阵列

`GL`- 分组变量水平
字符向量的单元阵列

算法

另类功能

应用

参考

扩展功能

C / C ++代码生成
生成使用MATLAB®编码器™C和C ++代码。

也可以看看

话题

介绍了在R2009a

统计和机器学习工具箱文档

金宝app

掌握机器学习：有步骤，分步指南与MATLAB

fitdist

句法

描述

例子

适合正常分布数据

安装一个内核分配到数据

适合正态分布应用于分组数据

飞度内核发行应用于分组数据

输入参数

X-输入数据列向量

DISTNAME-分布名特征向量|串标

组变量-分组变量分类数组|逻辑或数字矢量|字符数组|字符串数组|字符向量的单元阵列

名称 - 值对参数

“截尾”-截尾数据逻辑标志0（默认）|逻辑值的矢量

'频率'-观测频率1（默认）|非负整数值的矢量

“选项”-控制参数结构体

'NTrials'-试验次数正整数值

“西塔”-阈值参数0（默认）|标值

'亩'-位置参数0（默认）|标值

'核心'-核平滑型'正常'（默认）|'框'|'三角形'|'epanechnikov'

'金宝app支持'-核密度支持金宝app“无界”（默认）|'正'|二元素矢量

'宽度'-核平滑窗口的带宽标值

输出参数

PD- 概率分布概率分布对象

PDCA- 概率分布对象单元阵列

GN- 组标签字符向量的单元阵列

GL- 分组变量水平字符向量的单元阵列

算法

另类功能

应用

参考

扩展功能

C / C ++代码生成生成使用MATLAB®编码器™C和C ++代码。

也可以看看

话题

介绍了在R2009a

统计和机器学习工具箱文档

金宝app

掌握机器学习：有步骤，分步指南与MATLAB

`X`-输入数据
列向量

`DISTNAME`-分布名
特征向量|串标

`组变量`-分组变量
分类数组|逻辑或数字矢量|字符数组|字符串数组|字符向量的单元阵列

`“截尾”`-截尾数据逻辑标志
`0`（默认）|逻辑值的矢量

`'频率'`-观测频率
`1`（默认）|非负整数值的矢量

`“选项”`-控制参数
结构体

`'NTrials'`-试验次数
正整数值

`“西塔”`-阈值参数
`0`（默认）|标值

`'亩'`-位置参数
0（默认）|标值

`'核心'`-核平滑型
`'正常'`（默认）|`'框'`|`'三角形'`|`'epanechnikov'`

`'金宝app支持'`-核密度支持金宝app
`“无界”`（默认）|`'正'`|二元素矢量

`'宽度'`-核平滑窗口的带宽
标值

`PD`- 概率分布
概率分布对象

`PDCA`- 概率分布对象
单元阵列

`GN`- 组标签
字符向量的单元阵列

`GL`- 分组变量水平
字符向量的单元阵列

C / C ++代码生成
生成使用MATLAB®编码器™C和C ++代码。