主要内容

fitdist

拟合概率分布对象与数据

描述

例子

pd= fitdist (xdistname通过拟合指定的分布来创建概率分布对象distname到列向量中的数据x

例子

pd= fitdist (xdistname名称,值创建具有由一个或多个名称-值对参数指定的附加选项的概率分布对象。例如,您可以指示截尾数据或为迭代拟合算法指定控制参数。

例子

pdcagngl= fitdist(xdistname“通过”,groupvar通过拟合指定的分布来创建概率分布对象distname的数据x基于分组变量groupvar.它返回一个由拟合的概率分布对象组成的单元格数组,pdca,组标签的单元格数组,gn,以及分组变量级别的单元格数组,gl

例子

pdcagngl= fitdist(xdistname“通过”,groupvar名称,值使用由一个或多个名-值对参数指定的附加选项返回上述输出参数。例如,您可以指示截尾数据或为迭代拟合算法指定控制参数。

例子

全部折叠

拟合样本数据的正态分布,并使用直方图和分位数-分位数图检查拟合。

从数据文件中加载病人体重patients.mat

负载病人x =重量;

通过拟合数据来创建一个正态分布对象。

Pd = fitdist(x,“正常”
正态分布mu = 154 [148.728, 159.272] sigma = 26.5714 [23.3299, 30.8674]

分布对象显示包括平均值(μ)和标准差(σ),以及各参数的95%置信区间。

的对象函数pd求分布并生成随机数。显示支持的对象函数。金宝app

方法(pd)
类问题的方法。NormalDistribution: cdf iqr negloglik proflik truncate gather mean paramci random var icdf median pdf std

方法获得95%置信区间paramci函数。

Ci95 = paramci(pd)
ci95 =2×2148.7277 23.3299 159.2723 30.8674

指定显著性水平(α),得到不同置信水平的置信区间。计算99%置信区间。

Ci99 = paramci(pd,“α”. 01)
ci99 =2×2147.0213 22.4257 160.9787 32.4182

评估并绘制分布的pdf值。

X_values = 50:1:250;Y = pdf(pd,x_values);情节(x_values, y)

图中包含一个轴对象。axis对象包含一个line类型的对象。

方法创建正态分布拟合的直方图histfit函数。histfit使用fitdist拟合数据的分布。

histfit (x)

图中包含一个轴对象。axis对象包含两个类型为bar、line的对象。

直方图显示数据有两种模式,正态分布拟合的模式介于这两种模式之间。

使用qqplot创建样本数据的分位数-分位数图x相对于拟合分布的理论分位数值。

qqplot (x, pd)

图中包含一个轴对象。标题为QQ Plot of Sample Data versus Distribution的坐标轴对象包含3个类型为line的对象。

图表不是一条直线,这表明数据不遵循正态分布。

从数据文件中加载病人体重patients.mat

负载病人x =重量;

通过将内核分发对象与数据匹配来创建内核分发对象。使用Epanechnikov核函数。

Pd = fitdist(x,“内核”“内核”“epanechnikov”
pd = KernelDistribution内核= epanechnikov带宽= 14.3792支持=无界金宝app

绘制分布的pdf。

X_values = 50:1:250;Y = pdf(pd,x_values);情节(x_values, y)

图中包含一个轴对象。axis对象包含一个line类型的对象。

从数据文件中加载患者体重和性别patients.mat

负载病人x =重量;

通过拟合数据来创建正态分布对象,并按患者性别分组。

[pdca,gn,gl] = fitdist(x,“正常”“通过”、性别)
pdca =1×2单元格数组{1 x1概率。NormalDistribution} {1x1问题。NormalDistribution}
gn =2 x1细胞{'男'}{'女'}
gl =2 x1细胞{'男'}{'女'}

单元格数组pdca包含两个概率分布对象,每个性别组一个。单元格数组gn包含两个组标签。单元格数组gl包含两个组级别。

查看单元格数组中的每个分布pdca为了比较平均值,μ,为标准差,σ,按患者性别分组。

女性= pdca{1}%女性分布
正态分布mu = 180.532 [177.833, 183.231] sigma = 9.19322 [7.63933, 11.5466]
男性= pdca{2}男性百分比分布
正态分布mu = 130.472 [128.183, 132.76] sigma = 8.30339 [6.96947, 10.2736]

计算每个分布的pdf。

X_values = 50:1:250;Femalepdf = pdf(female,x_values);Malepdf = pdf(male,x_values);

绘制pdf图,按性别进行体重分布的可视化比较。

图绘制(x_values femalepdf,“线宽”, 2)情节(x_values malepdf,“颜色”“r”“线型”':'“线宽”2)传说(gn,“位置”“东北”)举行

图中包含一个轴对象。axis对象包含2个line类型的对象。这些物体代表男性,女性。

从数据文件中加载患者体重和性别patients.mat

负载病人x =重量;

通过拟合数据来创建内核分布对象,并按患者性别分组。使用三角核函数。

[pdca,gn,gl] = fitdist(x,“内核”“通过”、性别、“内核”“三角形”);

查看单元格数组中的每个分布pdca查看每个性别的内核分布。

女性= pdca{1}%女性分布
female = KernelDistribution内核= triangle带宽= 5.08961 Support = unbou金宝appnded
男性= pdca{2}男性百分比分布
male = KernelDistribution内核= triangle带宽= 4.25894 Support = unbou金宝appnded

计算每个分布的pdf。

X_values = 50:1:250;Femalepdf = pdf(female,x_values);Malepdf = pdf(male,x_values);

绘制pdf图,按性别进行体重分布的可视化比较。

图绘制(x_values femalepdf,“线宽”, 2)情节(x_values malepdf,“颜色”“r”“线型”':'“线宽”2)传说(gn,“位置”“东北”)举行

图中包含一个轴对象。axis对象包含2个line类型的对象。这些物体代表男性,女性。

输入参数

全部折叠

输入数据,指定为列向量。fitdist忽略了x.此外,任何值在审查矢量或频率矢量引起fitdist中对应的值x

数据类型:

分布名称,指定为以下字符向量或字符串标量之一。指定的分布。distname确定返回的概率分布对象的类型。

分布的名字 描述 分布对象
“β” 贝塔分布 BetaDistribution
“二” 二项分布 BinomialDistribution
“BirnbaumSaunders” Birnbaum-Saunders分布 BirnbaumSaundersDistribution
“毛刺” 毛刺分布 BurrDistribution
“指数” 指数分布 ExponentialDistribution
“极端值”“电动汽车” 极值分布 ExtremeValueDistribution
“伽马” 伽马分布 GammaDistribution
“广义极值”“gev” 广义极值分布 GeneralizedExtremeValueDistribution
广义帕累托的“全科医生” 广义帕累托分布 GeneralizedParetoDistribution
“正常”的一半“环” Half-normal分布 HalfNormalDistribution
“InverseGaussian” 逆高斯分布 InverseGaussianDistribution
“内核” 内核分配 KernelDistribution
“物流” 物流配送 LogisticDistribution
“Loglogistic” Loglogistic分布 LoglogisticDistribution
对数正态的 对数正态分布 LognormalDistribution
“Nakagami” Nakagami分布 NakagamiDistribution
“负二项”“nbin” 负二项分布 NegativeBinomialDistribution
“正常” 正态分布 NormalDistribution
“泊松” 泊松分布 PoissonDistribution
“瑞利” 瑞利分布 RayleighDistribution
“Rician” Rician分布 RicianDistribution
“稳定” 稳定分布 StableDistribution
“tLocationScale” tLocation-Scale分布 tLocationScaleDistribution
“威布尔”“wbl” 威布尔分布 WeibullDistribution

分组变量,指定为分类数组、逻辑或数字向量、字符数组、字符串数组或字符向量的单元格数组。分组变量中的每个惟一值定义一个组。

例如,如果性别单元格数组的字符向量与值“男”而且“女”,你可以使用性别作为分组变量,以按性别拟合数据的分布。

通过指定分组变量的单元格数组,可以使用多个分组变量。如果观察值的所有指定分组变量值相同,则将观察值放在同一组中。

例如,如果吸烟者逻辑向量有值吗0对于不吸烟者和1对于吸烟者,然后指定单元格数组{性别、吸烟}将观察结果分为四组:男性吸烟者、男性不吸烟者、女性吸烟者和女性不吸烟者。

例子:{性别、吸烟}

数据类型:分类|逻辑|||字符|字符串|细胞

名称-值参数

的可选逗号分隔对名称,值参数。的名字参数名称和价值对应的值。的名字必须出现在引号内。您可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:fitdist (x,“仁”,“仁”,“三角形”)中的数据适合内核分布对象x使用三角核函数。

截尾数据的逻辑标志,指定为与输入向量大小相同的逻辑值向量x.取值为1当相应的元素在x这是一个右删减的观察和0当对应的元素是精确观测时。默认值是的向量0S,表示所有的观测都是准确的。

fitdist忽略任何一个这个审查向量中的值。此外,任何x或者频率矢量的原因fitdist忽略审查向量中的相应值。

这个论点只有在以下情况下才成立distname“BirnbaumSaunders”“毛刺”“指数”“ExtremeValue”“伽马”“InverseGaussian”“内核”“物流”“Loglogistic”对数正态的“Nakagami”“正常”“Rician”“tLocationScale”,或“威布尔”

数据类型:逻辑

观测频率,指定为与输入向量大小相同的非负整数值向量x.频率向量的每个元素指定了中相应元素的频率x.默认值是的向量1S,表示中的每个值x只出现一次。

fitdist忽略任何一个这个频率向量中的值。此外,任何x或者说是审查向量的原因fitdist忽略频率矢量中相应的值。

数据类型:|

迭代拟合算法的控制参数,指定为创建时使用的结构statset

数据类型:结构体

二项分布的试验次数,指定为正整数值。

此论点仅当distname“二”(二项分布)。

例子:“Ntrials”,10

数据类型:|

广义帕累托分布的位置(阈值)参数,指定为标量。

此论点仅当distname广义帕累托的(广义Pareto分布)。

样例数据时默认值为0x只包含非负值。您必须指定θ如果x包括负值。

例子:“θ”,1

数据类型:|

半正态分布的位置参数,指定为标量。

此论点仅当distname“正常”的一半(half-normal分布)。

样例数据时默认值为0x只包含非负值。您必须指定μ如果x包括负值。

例子:“亩”,1

数据类型:|

内核分发的内核平滑类型,指定为以下之一:

  • “正常”

  • “盒子”

  • “三角形”

  • “epanechnikov”

您必须指定distname作为“内核”使用此选项。

内核分布的内核密度支持,指定为金宝app“无限”“积极”,或者一个二元向量。

价值 描述
“无限” 密度可以延伸到整条实线。
“积极” 密度限制在正值。

或者,您可以指定一个两元向量,为密度的支持提供有限的下限和上限。金宝app

您必须指定distname作为“内核”使用此选项。

数据类型:||字符|字符串

核分布的核平滑窗口带宽,指定为标量值。的默认值fitdist是估计正态密度的最佳值,但您可能希望选择一个较小的值来显示多个模式等特征。您必须指定distname作为“内核”使用此选项。

数据类型:|

输出参数

全部折叠

概率分布,作为概率分布对象返回。指定的分布。distname确定返回概率分布对象的类类型。有关的名单distname值和对应的概率分布对象,请参见distname

指定类型的概率分布对象distname,作为单元格数组返回。有关的名单distname值和对应的概率分布对象,请参见distname

组标签,作为字符向量的单元格数组返回。

分组变量级别,作为包含每个分组变量一列的字符向量的单元格数组返回。

算法

fitdist函数使用最大似然估计拟合大多数分布。两个例外是未删减数据的正态分布和对数正态分布。

  • 对于无截尾正态分布,西格玛参数的估计值是方差无偏估计值的平方根。

  • 对于无截尾对数正态分布,西格玛参数的估计值是数据对数方差的无偏估计值的平方根。

选择功能

  • 分布更健康App为您打开一个图形用户界面,以便从工作区导入数据,并交互式地为该数据拟合一个概率分布。然后,您可以将该分布作为概率分布对象保存到工作区。使用打开Distribution Fitter应用程序distributionFitter,或单击“应用程序”页签上的“分发检验器”。

  • 要将分布拟合到左截尾、双截尾或间隔截尾数据,请使用大中型企业.您可以通过使用大中型企业函数创建一个概率分布对象makedist函数。有关示例,请参见查找双重审查数据的mle

参考文献

[1]约翰逊,N. L., S. Kotz, N. Balakrishnan。连续单变量分布.第1卷,霍博肯,新泽西州:Wiley-Interscience, 1993。

[2]约翰逊,N. L., S. Kotz, N. Balakrishnan。连续单变量分布.卷2,霍博肯,新泽西州:Wiley-Interscience, 1994。

[3]鲍曼,a.w.和A.阿扎里尼。平滑技术在数据分析中的应用.纽约:牛津大学出版社,1997年。

扩展功能

在R2009a中引入