fitdist

拟合概率分布对象数据

描述

PD= fitdist(XDISTNAME通过拟合通过指定的分发创建一个概率分布对象DISTNAME在列向量的数据X

PD= fitdist(XDISTNAME名称,值创建具有由一个或多个名称值对参数中指定的附加选项的概率分布的对象。例如,您可以指示截尾数据或迭代拟合算法指定的控制参数。

[PDCAGNGL] = fitdist(XDISTNAME,'通过',组变量通过拟合通过指定的分布创建概率分布的对象DISTNAME在数据X基于分组变量组变量。它返回配概率分布的对象的单元阵列,PDCA,组标签的单元阵列,GN和分组可变水平的单元阵列,GL

[PDCAGNGL] = fitdist(XDISTNAME,'通过',组变量名称,值返回使用由一个或多个名称值对参数中指定的附加选项上述输出参数。例如,您可以指示截尾数据或迭代拟合算法指定的控制参数。

例子

全部收缩

加载样本数据。创建包含患者的重量数据的矢量。

加载医院X = hospital.Weight;

由它拟合的数据来创建一个正常的分布对象。

PD = fitdist(X,'正常'
PD =正态分布正态分布亩= 154 [148.728,159.272]西格玛= 26.5714 [23.3299,30.8674]

旁边的参数估计值的时间间隔是分布参数的95%置信区间。

绘制分布的PDF文件。

x_values = 50:1:250;Y = PDF(PD,x_values);图(x_values,Y,'行宽',2)

加载样本数据。创建包含患者的重量数据的矢量。

加载医院X = hospital.Weight;

由它拟合的数据来创建一个内核分配对象。使用Epanechnikov内核函数。

PD = fitdist(X,'核心''核心''epanechnikov'
PD = KernelDistribution内核= epanechnikov带宽= 14.3792夹持=无界金宝app

绘制分布的PDF文件。

x_values = 50:1:250;Y = PDF(PD,x_values);情节(x_values,y)的

加载样本数据。创建包含患者的重量数据的矢量。

加载医院X = hospital.Weight;

他们拟合数据,按患者性别分组创建正态分布的对象。

性别= hospital.Sex;[PDCA,GN,GL = fitdist(X,'正常''通过',性别)
PDCA =1×2细胞{的1x1 prob.NormalDistribution} {的1x1 prob.NormalDistribution}
GN =2×1单元阵列{'女人男人' }
GL =2×1单元阵列{'女人男人' }

单元阵列PDCA包含两个概率分布的目的,一个用于每个性别组。单元阵列GN包含两个组标签。单元阵列GL包含两个组的水平。

查看在单元阵列中每个分布PDCA比较平均,和标准偏差,西格玛,按患者性别分组。

女= PDCA {1}%分布为女性
女=正态分布正态分布亩= 130.472 [128.183,132.76]标准差= 8.30339 [6.96947,10.2736]
雄性= PDCA {2}%分布为男性
雄性=正态分布正态分布亩= 180.532 [177.833,183.231]标准差= 9.19322 [7.63933,11.5466]

计算每个分布的PDF文件。

x_values = 50:1:250;femalepdf = PDF(雌性,x_values);malepdf = PDF(雄性,x_values);

绘制PDF文件按性别重量分布的视觉比较。

图图(x_values,femalepdf,'行宽'2)保持图(x_values,malepdf,'颜色''R''的LineStyle'':''行宽',2)图例(GN,'位置''东北')保持

加载样本数据。创建包含患者的重量数据的矢量。

加载医院X = hospital.Weight;

他们拟合数据,按患者性别分组创建内核分配对象。使用三角核函数。

性别= hospital.Sex;[PDCA,GN,GL = fitdist(X,'核心''通过',性别,'核心''三角形');

查看在单元阵列中每个分布PDCA看到每个性别的核心分布。

女= PDCA {1}%分布为女性
女= KernelDistribution内核=三角形带宽= 4.25894支持=无界金宝app
雄性= PDCA {2}%分布为男性
雄性= KernelDistribution内核=三角形带宽= 5.08961支持=无界金宝app

计算每个分布的PDF文件。

x_values = 50:1:250;femalepdf = PDF(雌性,x_values);malepdf = PDF(雄性,x_values);

绘制PDF文件按性别重量分布的视觉比较。

图图(x_values,femalepdf,'行宽'2)保持图(x_values,malepdf,'颜色''R''的LineStyle'':''行宽',2)图例(GN,'位置''东北')保持

输入参数

全部收缩

输入数据,指定为列向量。fitdist忽略为NaN价值观X。此外,任何为NaN在审查载体或频率向量原因值fitdist忽略对应的值X

数据类型:

分配名称,指定为下面的特征向量或标量的字符串中的一个。由指定的分布DISTNAME确定返回的概率分布的对象的类型。

分布名称 描述 分销对象
“测试版” 贝塔分布 BetaDistribution
“二项式” 二项分布 二项分布
'BirnbaumSaunders' 伯恩鲍姆 - 桑德斯分布 BirnbaumSaundersDistribution
“毛刺” 伯尔分布 BurrDistribution
“指数” 指数分布 ExponentialDistribution
'ExtremeValue' 极值分布 ExtremeValueDistribution
“伽马” Gamma分布 伽玛分布
'GeneralizedExtremeValue' 广义极值分布 GeneralizedExtremeValueDistribution
'GeneralizedPareto' 广义帕累托分布 GeneralizedParetoDistribution
'HalfNormal' 半正态分布 HalfNormalDistribution
'InverseGaussian' 逆高斯分布 InverseGaussianDistribution
'核心' 内核分配 KernelDistribution
“物流” 物流配送 LogisticDistribution
'Loglogistic' Loglogistic分布 LoglogisticDistribution
“对数正态分布” 对数正态分布 LognormalDistribution
“中上” 中上分布 NakagamiDistribution
'NegativeBinomial' 负二项分布 NegativeBinomialDistribution
'正常' 正态分布 正态分布
“泊松 泊松分布 泊松分布
“瑞利” 瑞利分布 瑞利分布
“莱斯” 莱斯分布 RicianDistribution
'稳定' 稳定分布 StableDistribution
'tLocationScale' Ť位置尺度分布 tLocationScaleDistribution
“韦伯” 威布尔分布 韦伯分布

分组变量,指定为分类阵列,逻辑或数字向量,字符数组,字符串数组,或字符向量的单元阵列。在一个分组变量的每个唯一值定义的基团。

例如,如果性别是字符向量的单元阵列与值'男''女', 您可以使用性别作为分组变量,以适应​​按性别分配给您的数据。

多于一个的分组变量可以通过指定分组变量的单元阵列被使用。观察被放置在同一个组,如果他们有所有指定分组变量的共同价值观。

例如,如果抽烟者是具有值的逻辑矢量0对于非吸烟者和1为吸烟者,则指定单元阵列{性别,吸烟者}分歧意见分为四组:男性吸烟者,不吸烟男性,女性吸烟者和不吸烟女性。

例:{性别,吸烟者}

数据类型:明确的|合乎逻辑|||烧焦||细胞

名称 - 值对参数

指定可选的用逗号分隔的对名称,值参数。名称是参数的名称和是对应的值。名称必须出现引号内。您可以按照任何顺序指定多个名称和值对参数名1,值1,...,NameN,值N

例:fitdist(X, '内核', '核心', '三角形')适合内核分配对象的数据X使用三角核函数。

逻辑标志截尾数据,指定为逗号分隔的一对组成的“截尾”和逻辑值的矢量,其大小作为输入矢量同X。该值是1当在相应的元件X是右删失观察0当相应的元件是一种精确的观察。默认值是一个矢量0S,这表明所有观察是准确的。

fitdist忽略任何为NaN值在该截尾矢量。此外,任何为NaN价值观X或频矢量原因fitdist忽略在截尾矢量对应的值。

这种观点仅仅当DISTNAME'BirnbaumSaunders'“毛刺”“指数”'ExtremeValue'“伽马”'InverseGaussian''核心'“物流”'Loglogistic'“对数正态分布”“中上”'正常'“莱斯”'tLocationScale', 要么“韦伯”

数据类型:合乎逻辑

观测频率,指定为逗号分隔的一对组成的'频率'和非负整数的值的矢量,其大小作为输入矢量同X。频率向量的每个元素指定在相应的元件的频率X。默认值是一个矢量1S,这表明在每个值X只出现一次。

fitdist忽略任何为NaN值在这个频率矢量。此外,任何为NaN价值观X或截尾矢量原因fitdist忽略在频矢量对应的值。

数据类型:|

对于迭代拟合算法的控制参数,指定为逗号分隔的一对组成的“选项”与您共创结构使用statset

数据类型:结构

为二项式分布试验次数,指定为逗号分隔的一对组成的'NTrials'和正整数值。您必须指定DISTNAME“二项式”使用这个选项。

数据类型:|

阈值参数为广义Pareto分布,指定为逗号分隔的一对组成的“西塔”和标量值。您必须指定DISTNAME'GeneralizedPareto'使用这个选项。

数据类型:|

对于半正态分布位置参数,指定为逗号分隔的一对组成的'亩'和标量值。您必须指定DISTNAME'HalfNormal'使用这个选项。

数据类型:|

内核平滑型,指定为逗号分隔的一对组成的'核心'和以下情况之一:

  • '正常'

  • '框'

  • '三角形'

  • 'epanechnikov'

您必须指定DISTNAME'核心'使用这个选项。

核密度支撑,指定为逗号分隔的一金宝app对组成的'金宝app支持'“无界”'正'或两个元素的矢量。

“无界” 密度可以扩展到整个实线。
'正' 密度被限制为正值。

可替换地,可以指定有限的下限和上限给予用于支撑密度的两元素向量。金宝app

您必须指定DISTNAME'核心'使用这个选项。

数据类型:||烧焦|

内核平滑窗口的带宽,指定为逗号分隔的一对组成的'宽度'和标量值。通过使用缺省值fitdist是最佳估计正常密度,但你可能想选择一个更小的值来揭示功能,如多模式。您必须指定DISTNAME'核心'使用这个选项。

数据类型:|

输出参数

全部收缩

概率分布,返回一个概率分布对象。由指定的分布DISTNAME确定类别类型返回的概率分布的对象。

由指定类型的概率分布对象DISTNAME,返回为单元阵列。

组标签,返回作为字符向量的单元阵列。

分组变量水平,返回包含每个分组变量的一列字符向量的单元阵列。

算法

fitdist功能适合使用最大似然估计大多数发行。两个例外是与未经审查数据正常和对数正态分布。

  • 对于未经审查的正态分布,估计值西格玛参数的是方差的无偏估计的平方根。

  • 对于未经审查的对数正态分布,该估计值西格玛参数的是日志数据的方差的无偏估计的平方根。

另类功能

应用

分布钳工应用打开了一个图形用户界面,让你从工作区导入数据,并以交互方式拟合概率分布数据。然后,您可以保存分配到工作区的概率分布对象。采用开放式分布钳工应用distributionFitter,或单击应用程序选项卡上的分布钳工。

参考

[1]约翰逊,N. L.,S.科茨和N维文。连续单变量分布。卷。1,Hoboken的,NJ:WILEY-INTERSCIENCE,1993。

[2]约翰逊,N. L.,S.科茨和N维文。连续单变量分布。卷。2,Hoboken的,NJ:WILEY-INTERSCIENCE,1994。

[3]鲍曼,A. W.,和A. Azzalini。应用平滑技术数据分析。纽约:牛津大学出版社,1997年。

扩展功能

介绍了在R2009a