主要内容

fitdist

拟合概率分布对象与数据

描述

例子

pd=fitdist(xdistname通过拟合指定的分布,生成概率分布对象distname到列向量中的数据x

例子

pd=fitdist(xdistname名称、值使用一个或多个名称-值对参数指定的其他选项创建概率分布对象。例如,您可以指示经过审查的数据或为迭代拟合算法指定控制参数。

例子

pdcagngl]=fitdist(xdistname","By",,群变通过拟合指定的分布,生成概率分布对象distname将数据添加到x基于分组变量群变.它返回一个包含拟合概率分布对象的单元阵列,pdca,组标签的单元格数组,gn,以及分组可变级别的单元格数组,gl

例子

pdcagngl]=fitdist(xdistname","By",,群变名称、值使用由一个或多个名称-值对参数指定的附加选项返回上述输出参数。例如,可以为迭代拟合算法指定审查数据或控制参数。

例子

全部崩溃

对样本数据拟合正态分布,并使用直方图和分位数图检查拟合情况。

从数据文件加载患者权重病人垫

负载病人x =重量;

通过将正态分布对象拟合到数据来创建正态分布对象。

pd=fitdist(x,“正常”
pd=正态分布正态分布mu=154[148.728159.272]σ=26.5714[23.3299,30.8674]

分布对象显示包括平均值的参数估计()及标准偏差(σ),以及参数的95%置信区间。

的对象函数pd来评估分布并生成随机数。显示支持的对象函数。金宝app

方法(pd)
类概率正态分布的方法:cdf iqr negloglik proflik截断聚集平均参数随机变量icdf中值pdf标准

例如,通过使用帕拉姆奇函数。

ci95=参数CI(pd)
ci95 =2×2148.7277 23.3299 159.2723 30.8674

指定显著性水平(阿尔法)获取具有不同置信水平的置信区间。计算99%的置信区间。

ci99 = paramci (pd,“阿尔法”,.01)
ci99=2×2147.0213 22.4257 160.9787 32.4182

计算并绘制分布的pdf值。

x_值=50:1:250;y=pdf(pd,x_值);绘图(x_值,y)

图中包含一个轴对象。axes对象包含类型为line的对象。

创建一个直方图与正态分布拟合使用histfit函数。histfit使用fitdist使分布适合数据。

histfit (x)

图中包含一个轴对象。axis对象包含两个类型为bar, line的对象。

直方图显示数据有两种模态,正态分布拟合的模态在这两种模态之间。

使用qqplot创建样本数据分位数的分位数图x相对于拟合分布的理论分位数值。

qqplot(x,pd)

图中包含一个轴对象。标题为QQ样本数据与分布图的坐标轴对象包含3个类型为line的对象。

曲线不是一条直线,说明数据不是正态分布。

从数据文件加载患者权重病人垫

负载病人x =重量;

通过将内核分发对象与数据相匹配来创建它。使用Epanechnikov内核函数。

pd=fitdist(x,“内核”“内核”“epanechnikov”
pd=KernelDistribution内核=epanechnikov带宽=14.3792支持度=无界金宝app

绘制分布图的pdf。

x_值=50:1:250;y=pdf(pd,x_值);绘图(x_值,y)

图中包含一个轴对象。axes对象包含类型为line的对象。

从数据文件加载患者体重和性别病人垫

负载病人x =重量;

通过对数据进行拟合,创建正态分布对象,按患者性别分组。

(pdca gn, gl) = fitdist (x,“正常”“由”,性别)
pdca =1×2单元阵列{1 x1概率。NormalDistribution} {1 x1概率。NormalDistribution}
gn =2x1电池{“男性”}{‘女性’}
gl =2x1电池{“男性”}{‘女性’}

细胞数组pdca包含两个概率分布对象,每个性别组一个。细胞数组gn包含两个组标签。细胞数组gl包含两个组级别。

查看单元格数组中的每个分布pdca要比较平均值,,标准差,σ,按病人性别分组。

女性=pdca{1}%女性分布情况
女性=正态分布正态分布mu=180.532[177.833183.231]西格玛=9.19322[7.63933,11.5466]
男= pdca {2}%男性的分布
男性=正态分布正态分布mu=130.472[128.183,132.76]西格玛=8.30339[6.96947,10.2736]

计算每个分发版的pdf。

x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);

绘制pdf文件以直观地比较性别的体重分布。

图绘制(x_values femalepdf,“线宽”, 2)在…上绘图(x_值,PDF,“颜色”“r”“线型”':'“线宽”2)传说(gn,“位置”“东北”)持有

图中包含一个轴对象。axes对象包含2个line类型的对象。这些物体代表男性和女性。

从数据文件加载患者体重和性别病人垫

负载病人x =重量;

通过将核心分布对象与按患者性别分组的数据相匹配来创建它们。使用三角核函数。

(pdca gn, gl) = fitdist (x,“内核”“由”性别“内核”“三角形”);

查看单元格数组中的每个分布pdca查看每种性别的内核发行版。

女性=pdca{1}%女性分布情况
女性=内核分布内核=三角形带宽=5.08961支持=无限金宝app
男= pdca {2}%男性的分布
男性=内核分布内核=三角形带宽=4.25894支持=无限金宝app

计算每个分发版的pdf。

x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);

绘制pdf文件以直观地比较性别的体重分布。

图绘制(x_values femalepdf,“线宽”, 2)在…上绘图(x_值,PDF,“颜色”“r”“线型”':'“线宽”2)传说(gn,“位置”“东北”)持有

图中包含一个轴对象。axes对象包含2个line类型的对象。这些物体代表男性和女性。

输入参数

全部崩溃

输入数据,指定为列向量。fitdist忽略了价值观x.此外,任何值在截尾矢量或频率矢量引起fitdist中对应的值忽略x

数据类型:

分布名称,指定为以下字符向量或字符串标量之一。由distname确定返回的概率分布对象的类型。

分发名称 描述 分布对象
“贝塔” 贝塔分布 β分布
“二” 二项分布 BinomialDistribution
“BirnbaumSaunders” Birnbaum-Saunders分布 伯恩鲍姆萨分布
“伯尔” 毛刺分布 BurrDistribution
“指数” 指数分布 指数分布
“极值”“电动汽车” 极值分布 ExtremeValueDistribution
“伽马” 伽马分布 GammaDistribution
“广义极值”“gev” 广义极值分布 广义右旋分布
广义帕累托的“gp” 广义帕累托分布 广义分布
“半正常”“嗯” Half-normal分布 HalfNormalDistribution
“InverseGaussian” 逆高斯分布 逆高斯分布
“内核” 内核分配 KernelDistribution
“物流” 物流配送 LogisticDistribution
“后勤” Loglogistic分布 LoglogisticDistribution
对数正态的 对数正态分布 对数正态分布
“中谷” 中川分布 NakagamiDistribution
“负二项”“nbin” 负二项分布 NegativeBinomialDistribution
“正常” 正态分布 常态分配
“泊松” 泊松分布 泊松分布
“瑞利” 瑞利分布 RayleighDistribution
“Rician” 蓖麻分布 分布
“稳定” 稳定分布 StableDistribution
“tLocationScale” tLocation-Scale分布 tLocationScaleDistribution
“威布尔”“wbl” 威布尔分布 WeibullDistribution

分组变量,指定为分类数组、逻辑或数字向量、字符数组、字符串数组或字符向量的单元格数组。分组变量中的每个唯一值定义一个组。

例如,如果性别字符向量的单元格数组有值吗“男性”“女性”,你可以使用性别作为分组变量,以符合你的数据的性别分布。

通过指定分组变量的单元格数组,可以使用多个分组变量。如果观测值具有所有指定分组变量的公共值,则将它们放置在同一组中。

例如,如果吸烟者是具有值的逻辑向量0对于不吸烟者和1对于吸烟者,则指定单元格数组{性别,吸烟者}将观察分为四组:男性吸烟者、男性不吸烟者、女性吸烟者和女性不吸烟者。

例子:{性别,吸烟者}

数据类型:分类|逻辑|仅有一个的||字符|一串|单间牢房

名称-值参数

指定可选的逗号分隔的对名称、值参数。名称参数名和价值是对应的值。名称必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:Name1, Value1,…,的家

例子:fitdist(x,'Kernel','Kernel','triangle')中的数据拟合内核分布对象x用三角核函数。

审查数据的逻辑标志,指定为与输入向量大小相同的逻辑值向量x. 价值是1当相应的元素x这是一个经过右删失的观察结果0当对应的元素是一个精确的观测值时。默认值是一个向量0S,表明所有的观测结果都是准确的。

fitdist忽略任何此审查向量中的值。此外,任何价值观x或者是频率矢量引起的fitdist忽略截尾向量中的相应值。

此参数仅在以下情况下有效:distname“BirnbaumSaunders”“伯尔”“指数”“极端价值”“伽马”“InverseGaussian”“内核”“物流”“后勤”对数正态的“中谷”“正常”“Rician”“tLocationScale”“威布尔”

数据类型:逻辑

观察频率,指定为与输入向量大小相同的非负整数值向量x. 频率向量的每个元素指定中对应元素的频率x. 默认值是一个向量1S,表示中每个值x只出现一次。

fitdist忽略任何此频率向量中的值。此外,任何价值观x或者是截尾矢量原因fitdist忽略频率向量中的相应值。

数据类型:仅有一个的|

迭代拟合算法的控制参数,指定为使用statset

数据类型:结构

二项分布的试验次数,指定为正整数值。

此参数仅在以下情况下有效:distname“二”(二项分布)。

例子:“Ntrials”,10

数据类型:仅有一个的|

广义帕累托分布的位置(阈值)参数,指定为标量。

此参数仅在以下情况下有效:distname广义帕累托的(广义帕累托分布)。

当样本数据时默认值为0x仅包括非负值。您必须指定θ如果x包括负值。

例子:“theta”,1

数据类型:仅有一个的|

作为标量指定的半正态分布的位置参数。

此参数仅在以下情况下有效:distname“半正常”(half-normal分布)。

当样本数据时默认值为0x仅包括非负值。您必须指定如果x包括负值。

例子:"木",1

数据类型:仅有一个的|

Kernel smooth类型用于内核分布,指定为如下之一:

  • “正常”

  • “盒子”

  • “三角形”

  • “epanechnikov”

您必须指定distname作为“内核”使用此选项。

内核分布的内核密度支持,指定为金宝app“无限的”“肯定的”,或双元素向量。

价值 描述
“无限的” 密度可以延伸到整条实线。
“肯定的” 密度限制为正值。

或者,您可以指定一个二元向量,为密度的支持提供有限的下限和上限。金宝app

您必须指定distname作为“内核”使用此选项。

数据类型:仅有一个的||字符|一串

内核分布的内核平滑窗口的带宽,指定为标量值。默认值由fitdist对于估计正常密度是最佳的,但您可能希望选择较小的值来显示特征,例如多个模式。您必须指定distname作为“内核”使用此选项。

数据类型:仅有一个的|

输出参数

全部崩溃

概率分布,作为概率分布对象返回。由distname确定返回的概率分布对象的类类型。有关distname值和对应的概率分布对象,见distname

所指定类型的概率分布对象distname,作为单元格数组返回。有关distname值和对应的概率分布对象,见distname

组标签,作为字符向量的单元格数组返回。

分组变量级别,返回为字符向量的单元格数组,其中每个分组变量包含一列。

算法

fitdist函数使用最大似然估计拟合大多数分布。两个例外情况是未经审查数据的正态分布和对数正态分布。

  • 对于无偏正态分布,σ参数的估计值是方差无偏估计的平方根。

  • 对于未经检验的对数正态分布,西格玛参数的估计值是数据对数方差无偏估计的平方根。

替代功能

  • 分配装配工应用程序打开一个图形用户界面,供您从工作区导入数据,并以交互方式将概率分布拟合到该数据。然后,您可以将概率分布保存到工作区作为概率分布对象。使用distributionFitter,或单击“应用程序”选项卡上的“分发安装程序”。

  • 若要拟合左截、双截或间隔截数据的分布,请使用最大似然误差。您可以使用最大似然误差函数,并使用制造者函数。例如,请参见求双截尾数据的MLEs

参考文献

[1] 约翰逊,N.L.,S.Kotz和N.Balakrishnan。连续单变量分布第1卷,新泽西州霍博肯:威利国际科学出版社,1993年。

[2] 约翰逊,N.L.,S.Kotz和N.Balakrishnan。连续单变量分布.第2卷,霍博肯,新泽西州:威利-国际科学,1994。

[3] 鲍曼、A.W.和A.Azzalini。数据分析中应用的平滑技术.纽约:牛津大学出版社,1997。

扩展能力

介绍了R2009a