主要内容

fitdist

拟合概率分布对象与数据

描述

例子

pd= fitdist (xdistname指定的分布来创建概率分布对象distname到列向量的数据x

例子

pd= fitdist (xdistname名称,值创建具有由一个或多个名称-值对参数指定的附加选项的概率分布对象。例如,您可以指示删减数据或为迭代拟合算法指定控制参数。

例子

(pdcagngl] = fitdist(xdistname“通过”,groupvar指定的分布来创建概率分布对象distname中的数据x根据分组变量groupvar。它返回一个拟合概率分布对象的单元数组,pdca,组标签的单元数组,gn,以及分组可变级别的单元格数组,gl

例子

(pdcagngl] = fitdist(xdistname“通过”,groupvar名称,值使用由一个或多个名称-值对参数指定的附加选项返回上述输出参数。例如,您可以指示删减数据或为迭代拟合算法指定控制参数。

例子

全部折叠

拟合样本数据的正态分布,并使用直方图和分位数-分位数图检验拟合。

从数据文件中加载患者的体重patients.mat

负载病人x =权重;

通过拟合数据来创建一个正态分布对象。

Pd = fitdist(x,“正常”
正态分布mu = 154 [148.728, 159.272] sigma = 26.5714 [23.3299, 30.8674]

分布对象显示包括平均值(μ)及标准差(σ)和参数的95%置信区间。

的对象函数pd计算分布并生成随机数。显示支持的对象函数。金宝app

方法(pd)
类的方法。NormalDistribution: cdf iqr negloglik proflik truncate gather mean paramci random var icdf median pdf std

例如,使用。获取95%置信区间paramci函数。

Ci95 = paramci(pd)
ci95 =2×2148.7277 23.3299 159.2723 30.8674

指定显著性水平(α),以获得具有不同置信水平的置信区间。计算99%置信区间。

Ci99 = paramci(pd,“α”. 01)
ci99 =2×2147.0213 22.4257 160.9787 32.4182

计算并绘制分布的pdf值。

X_values = 50:1:250;Y = pdf(pd,x_values);情节(x_values, y)

图包含一个轴对象。axes对象包含line类型的对象。

创建具有正态分布拟合的直方图histfit函数。histfit使用fitdist拟合数据的分布

histfit (x)

图包含一个轴对象。axis对象包含2个类型为bar, line的对象。

直方图显示数据有两个模态,正态分布拟合的模态在这两个模态之间。

使用qqplot创建样本数据的分位数-分位数图x与拟合分布的理论分位数值比较。

qqplot (x, pd)

图包含一个轴对象。标题为QQ Plot of Sample Data versus Distribution的轴对象包含3个类型为line的对象。

该图不是一条直线,表明数据不服从正态分布。

从数据文件中加载患者的体重patients.mat

负载病人x =权重;

通过将内核分发对象与数据匹配来创建内核分发对象。使用Epanechnikov核函数。

Pd = fitdist(x,“内核”“内核”“epanechnikov”
pd = KernelDistribution内核= epanechnikov带宽= 14.3792支持=无界金宝app

绘制分布的pdf。

X_values = 50:1:250;Y = pdf(pd,x_values);情节(x_values, y)

图包含一个轴对象。axes对象包含line类型的对象。

从数据文件中加载患者的体重和性别patients.mat

负载病人x =权重;

通过将其拟合到数据中创建正态分布对象,并按患者性别分组。

[pdca,gn,gl] = fitdist(x,“正常”“通过”、性别)
pdca =1×2单元阵列{1 x1概率。正态分布}{1x1 probb。NormalDistribution}
gn =2 x1细胞{“男”}{“女”}
gl =2 x1细胞{“男”}{“女”}

单元阵列pdca包含两个概率分布对象,每个性别组一个。单元阵列gn包含两个组标签。单元阵列gl包含两个组级别。

查看单元格数组中的每个分布pdca为了比较平均值,μ,标准差,σ,按患者性别分组。

女= pdca{1}女性的百分比分布
正态分布mu = 180.532 [177.833, 183.231] sigma = 9.19322 [7.63933, 11.5466]
男性= pdca{2}男性分布
正态分布mu = 130.472 [128.183, 132.76] sigma = 8.30339 [6.96947, 10.2736]

计算每个分布的pdf。

X_values = 50:1:250;Femalepdf = pdf(female,x_values);Malepdf = pdf(male,x_values);

绘制pdf,以直观地比较按性别分列的体重分布。

图绘制(x_values femalepdf,“线宽”, 2)情节(x_values malepdf,“颜色”“r”“线型”“:”“线宽”2)传说(gn,“位置”“东北”)举行

图包含一个轴对象。axes对象包含2个line类型的对象。这些物体代表男性,女性。

从数据文件中加载患者的体重和性别patients.mat

负载病人x =权重;

通过将其拟合到数据中来创建内核分布对象,并按患者性别分组。使用三角核函数。

[pdca,gn,gl] = fitdist(x,“内核”“通过”、性别、“内核”“三角形”);

查看单元格数组中的每个分布pdca查看每个性别的内核分布。

女= pdca{1}女性的百分比分布
female = KernelDistribution Kernel = triangle Bandwidth = 5.08961 金宝appSupport = unbounded
男性= pdca{2}男性分布
male = KernelDistribution Kernel = triangle Bandwidth = 4.25894 金宝appSupport = unbounded

计算每个分布的pdf。

X_values = 50:1:250;Femalepdf = pdf(female,x_values);Malepdf = pdf(male,x_values);

绘制pdf,以直观地比较按性别分列的体重分布。

图绘制(x_values femalepdf,“线宽”, 2)情节(x_values malepdf,“颜色”“r”“线型”“:”“线宽”2)传说(gn,“位置”“东北”)举行

图包含一个轴对象。axes对象包含2个line类型的对象。这些物体代表男性,女性。

输入参数

全部折叠

输入数据,指定为列向量。fitdist忽略了x。此外,任何值在滤波矢量或频率矢量引起fitdist中对应的值x

数据类型:

分发名称,指定为以下字符向量或字符串标量之一。指定的分布distname确定返回的概率分布对象的类型。

分布的名字 描述 分布对象
“β” 贝塔分布 BetaDistribution
“二” 二项分布 BinomialDistribution
“BirnbaumSaunders” Birnbaum-Saunders分布 BirnbaumSaundersDistribution
“毛刺” 毛刺分布 BurrDistribution
“指数” 指数分布 ExponentialDistribution
“极端值”“电动汽车” 极值分布 ExtremeValueDistribution
“伽马” 伽马分布 GammaDistribution
“广义极值”“gev” 广义极值分布 GeneralizedExtremeValueDistribution
广义帕累托的“全科医生” 广义帕累托分布 GeneralizedParetoDistribution
“正常”的一半“环” Half-normal分布 HalfNormalDistribution
“InverseGaussian” 逆高斯分布 InverseGaussianDistribution
“内核” 内核分配 KernelDistribution
“物流” 物流配送 LogisticDistribution
“Loglogistic” Loglogistic分布 LoglogisticDistribution
对数正态的 对数正态分布 LognormalDistribution
“Nakagami” Nakagami分布 NakagamiDistribution
“负二项”“nbin” 负二项分布 NegativeBinomialDistribution
“正常” 正态分布 NormalDistribution
“泊松” 泊松分布 PoissonDistribution
“瑞利” 瑞利分布 RayleighDistribution
“Rician” Rician分布 RicianDistribution
“稳定” 稳定分布 StableDistribution
“tLocationScale” tLocation-Scale分布 tLocationScaleDistribution
“威布尔”“wbl” 威布尔分布 WeibullDistribution

分组变量,指定为分类数组、逻辑或数字向量、字符数组、字符串数组或字符向量的单元格数组。分组变量中的每个惟一值定义一个组。

例如,如果性别是具有值的字符向量的单元格数组“男”“女”,你可以用性别作为分组变量,按性别拟合数据的分布。

通过指定分组变量的单元格数组,可以使用多个分组变量。如果所有指定的分组变量的值相同,则将观察值放在同一组中。

例如,如果吸烟者逻辑向量有值吗0对于不吸烟者和1对于吸烟者,则指定单元格数组{性别、吸烟}将观察结果分为四组:男性吸烟者、男性不吸烟者、女性吸烟者和女性不吸烟者。

例子:{性别、吸烟}

数据类型:分类|逻辑|||字符|字符串|细胞

名称-值参数

指定可选的逗号分隔对名称,值参数。名字是参数名和吗价值是对应的值。名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数,如Name1, Value1,…,的家

例子:fitdist (x,“仁”,“仁”,“三角形”)将内核分布对象与中的数据匹配x用三角核函数。

截尾数据的逻辑标志,指定为与输入向量大小相同的逻辑值向量x。值为1当对应的元素在x经过正确审查的观察和0当对应的元素是一个精确的观测值时。默认是的向量0S,表示所有的观测值都是准确的。

fitdist忽略任何一个这个滤波向量中的值。此外,任何x或者频率矢量的原因fitdist忽略截断向量中的相应值。

只有当distname“BirnbaumSaunders”“毛刺”“指数”“ExtremeValue”“伽马”“InverseGaussian”“内核”“物流”“Loglogistic”对数正态的“Nakagami”“正常”“Rician”“tLocationScale”,或“威布尔”

数据类型:逻辑

观测频率,指定为与输入向量大小相同的非负整数值向量x。频率向量的每个元素指定中对应元素的频率x。默认是的向量1S,表示中的每个值x只出现一次。

fitdist忽略任何一个这个频率向量中的值。此外,任何x或者是滤波向量的原因fitdist忽略频率矢量中相应的值。

数据类型:|

迭代拟合算法的控制参数,指定为使用创建的结构statset

数据类型:结构体

二项分布的试验次数,指定为正整数值。

此参数仅在以下情况下有效distname“二”(二项分布)。

例子:“Ntrials”,10

数据类型:|

广义帕累托分布的位置(阈值)参数,用标量指定。

此参数仅在以下情况下有效distname广义帕累托的(广义Pareto分布)。

默认值为0x只包含非负值。你必须说明θ如果x包括负值。

例子:“θ”,1

数据类型:|

半正态分布的位置参数,指定为标量。

此参数仅在以下情况下有效distname“正常”的一半(half-normal分布)。

默认值为0x只包含非负值。你必须说明μ如果x包括负值。

例子:“亩”,1

数据类型:|

内核发行版的内核平滑类型,指定为以下之一:

  • “正常”

  • “盒子”

  • “三角形”

  • “epanechnikov”

你必须说明distname作为“内核”要使用此选项。

内核分布的内核密度支持,指定为金宝app“无限”“积极”,或者一个双元素向量。

价值 描述
“无限” 密度可以延伸到整条实线。
“积极” 密度被限制为正值。

或者,您可以指定一个双元素向量,给出有限的下限和上限,以支持密度。金宝app

你必须说明distname作为“内核”要使用此选项。

数据类型:||字符|字符串

核分布的核平滑窗口的带宽,用标量值指定。使用的默认值fitdist是估计正常密度的最佳值,但您可能希望选择较小的值来显示多模式等特征。你必须说明distname作为“内核”要使用此选项。

数据类型:|

输出参数

全部折叠

概率分布,作为概率分布对象返回。指定的分布distname确定返回的概率分布对象的类类型。如欲查阅distname值和对应的概率分布对象,参见distname

指定类型的概率分布对象distname,作为单元格数组返回。如欲查阅distname值和对应的概率分布对象,参见distname

分组标签,作为字符向量的单元格数组返回。

分组变量级别,作为字符向量的单元格数组返回,每个分组变量包含一列。

算法

fitdist函数拟合使用最大似然估计的大多数分布。两种例外情况是未经审查数据的正态分布和对数正态分布。

  • 对于无截尾正态分布,sigma参数的估计值是方差无偏估计值的平方根。

  • 对于未删减对数正态分布,sigma参数的估计值是数据对数方差无偏估计值的平方根。

选择功能

  • 分布更健康App打开一个图形用户界面,让你从工作区导入数据,并以交互方式拟合该数据的概率分布。然后,您可以将该分布保存为一个概率分布对象。打开分布筛选器应用程序使用distributionFitter,或单击“应用程序”选项卡上的“分发筛选器”。

  • 若要将分布拟合到左截尾、双截尾或间隔截尾数据,请使用大中型企业。可以找到最大似然估计大中型企业函数创建一个概率分布对象makedist函数。使用示例请参见寻找双重审查数据的最大似然

参考文献

[1]约翰逊,n.l., S. Kotz和N.巴拉克里希南。连续单变量分布。第1卷,霍博肯,NJ: Wiley-Interscience, 1993。

[2]约翰逊,n.l., S. Kotz和N.巴拉克里希南。连续单变量分布。第2卷,霍博肯,NJ: Wiley-Interscience, 1994。

鲍曼,A. W.和A.阿扎利尼。应用平滑技术进行数据分析。纽约:牛津大学出版社,1997。

扩展功能

在R2009a中引入