主要内容

fitdist

合适的概率分布对象的数据

描述

例子

pd= fitdist (x,distname)创建一个概率分布对象由指定的分布distname数据的列向量x

例子

pd= fitdist (x,distname,名称,值)创建概率分布对象与附加选项指定一个或多个名称-值对参数。例如,您可以显示数据审查或指定迭代匹配算法的控制参数。

例子

(pdca,gn,gl)= fitdist (x,distname“通过”,groupvar)创建概率分布对象由指定的分布distname的数据x基于分组变量groupvar。它返回一个合适的概率分布对象的单元阵列,pdca单元阵列的标签,gn和一个单元阵列分组变量的水平,gl

例子

(pdca,gn,gl)= fitdist (x,distname“通过”,groupvar,名称,值)上面返回输出参数使用由一个或多个指定附加选项名称-值对参数。例如,您可以显示数据审查或指定迭代匹配算法的控制参数。

例子

全部折叠

样本数据符合正态分布,研究适合利用直方图和quantile-quantile阴谋。

从数据文件加载病人体重patients.mat

负载病人x =重量;

创建一个正态分布对象通过拟合数据。

pd = fitdist (x,“正常”)
pd = NormalDistribution正态分布μ= 154[148.728,159.272]σ= 26.5714 (23.3299,30.8674)

分布对象显示包括参数估计的意思(μ)和标准差(σ),和95%的置信区间参数。

您可以使用对象的功能pd评估分布和生成随机数。显示功能的支持对象。金宝app

方法(pd)
类问题的方法。NormalDistribution: cdf iqr negloglik proflik truncate gather mean paramci random var icdf median pdf std

例如,通过使用获得的95%的置信区间paramci函数。

ci95 = paramci (pd)
ci95 =2×2148.7277 23.3299 159.2723 30.8674

指定显著性水平(α)获得置信区间有不同的置信水平。计算99%置信区间。

ci99 = paramci (pd,“α”. 01)
ci99 =2×2147.0213 22.4257 160.9787 32.4182

评估和情节的pdf值分布。

x_values = 50:1:250;y = pdf (pd, x_values);情节(x_values, y)

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

创建一个直方图与正态分布符合使用histfit函数。histfit使用fitdist适合一个分布数据。

histfit (x)

图包含一个坐标轴对象。坐标轴对象包含2栏,类型的对象。

柱状图显示数据有两种模式,和正态分布的模式这两种模式之间。

使用qqplot创建一个quantile-quantile情节分位数的示例数据x与理论分位数的值拟合分布。

qqplot (x, pd)

图包含一个坐标轴对象。坐标轴对象与标题QQ的样本数据和分布包含3线类型的对象。

情节并不是一条直线,表明数据不服从正态分布。

从数据文件加载病人体重patients.mat

负载病人x =重量;

创建一个内核对象通过拟合的数据分布。使用Epanechnikov内核函数。

pd = fitdist (x,“内核”,“内核”,“epanechnikov”)
pd = KernelDistribution内核= = 14.3792支持=无限epanechnikov带宽金宝app

情节的pdf分布。

x_values = 50:1:250;y = pdf (pd, x_values);情节(x_values, y)

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

从数据文件加载病人体重和性别patients.mat

负载病人x =重量;

创建正态分布对象通过拟合的数据,按病人性别分组。

(pdca gn, gl) = fitdist (x,“正常”,“通过”、性别)
pdca =1×2单元阵列{1 x1概率。x1 prob.NormalDistribution NormalDistribution} {1}
gn =2 x1细胞{“男性”}{‘女性’}
gl =2 x1细胞{“男性”}{‘女性’}

细胞数组pdca包含两个概率分布的对象,一个用于每个性别组。细胞数组gn包含两组标签。细胞数组gl包含两个集团的水平。

查看每个单元阵列的分布pdca比较的意思,μ和标准偏差,σ,按病人性别分组。

女= pdca {1}%分布雌性
女= NormalDistribution正态分布μ= 180.532[177.833,183.231]σ= 9.19322 (7.63933,11.5466)
男= pdca {2}%分布男性
男= NormalDistribution正态分布μ= 130.472[128.183,132.76]σ= 8.30339 (6.96947,10.2736)

计算每个分布的pdf。

x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);

情节的pdf视觉比较性别的重量分布。

图绘制(x_values femalepdf,“线宽”,2)情节(x_values malepdf,“颜色”,“r”,“线型”,“:”,“线宽”2)传说(gn,“位置”,“东北”)举行

图包含一个坐标轴对象。坐标轴对象包含2线类型的对象。这些对象代表男性,女性。

从数据文件加载病人体重和性别patients.mat

负载病人x =重量;

创建内核对象通过拟合的数据分布,按病人性别分组。使用一个三角形的内核函数。

(pdca gn, gl) = fitdist (x,“内核”,“通过”、性别、“内核”,“三角形”);

查看每个单元阵列的分布pdca每个性别的内核发行版。

女= pdca {1}%分布雌性
女= KernelDistribution内核=三角形带宽= 5.08961 =无限的支持金宝app
男= pdca {2}%分布男性
男= KernelDistribution内核=三角形带宽= 4.25894 =无限的支持金宝app

计算每个分布的pdf。

x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);

情节的pdf视觉比较性别的重量分布。

图绘制(x_values femalepdf,“线宽”,2)情节(x_values malepdf,“颜色”,“r”,“线型”,“:”,“线宽”2)传说(gn,“位置”,“东北”)举行

图包含一个坐标轴对象。坐标轴对象包含2线类型的对象。这些对象代表男性,女性。

输入参数

全部折叠

输入数据,指定为一个列向量。fitdist忽略了x。此外,任何审查向量或频率向量中的值的原因fitdist忽略相应的值x

数据类型:

分布的名字,指定为以下特征向量或字符串标量之一。指定的分布distname确定返回的概率分布对象的类型。

分布的名字 描述 分布对象
“β” 贝塔分布 BetaDistribution
“二” 二项分布 BinomialDistribution
“BirnbaumSaunders” Birnbaum-Saunders分布 BirnbaumSaundersDistribution
“毛刺” 毛刺分布 BurrDistribution
“指数” 指数分布 ExponentialDistribution
“极端值”“电动汽车” 极端值分布 ExtremeValueDistribution
“伽马” 伽马分布 GammaDistribution
“广义极值”“gev” 广义极值分布 GeneralizedExtremeValueDistribution
广义帕累托的“全科医生” 广义帕累托分布 GeneralizedParetoDistribution
“正常”的一半“环” Half-normal分布 HalfNormalDistribution
“InverseGaussian” 逆高斯分布 InverseGaussianDistribution
“内核” 内核分配 KernelDistribution
“物流” 物流配送 LogisticDistribution
“Loglogistic” Loglogistic分布 LoglogisticDistribution
对数正态的 对数正态分布 LognormalDistribution
“Nakagami” Nakagami分布 NakagamiDistribution
“负二项”“nbin” 负二项分布 NegativeBinomialDistribution
“正常” 正态分布 NormalDistribution
“泊松” 泊松分布 PoissonDistribution
“瑞利” 瑞利分布 RayleighDistribution
“Rician” Rician分布 RicianDistribution
“稳定” 稳定分布 StableDistribution
“tLocationScale” tLocation-Scale分布 tLocationScaleDistribution
“威布尔”“wbl” 威布尔分布 WeibullDistribution

分组变量,数组指定为一个分类、逻辑或数值向量,字符数组,字符串数组或单元阵列特征向量。每个分组变量定义了一组独特的价值。

例如,如果性别是一个单元阵列特征向量的值“男”“女”,你可以使用性别作为分组变量符合性别分布数据。

可以使用多个分组变量指定一个单元阵列的分组变量。观察被放在同一组如果他们有所有指定的分组变量的共同价值观。

例如,如果吸烟者是一个逻辑向量和价值观0对于不吸烟者和1对于吸烟者,然后指定单元阵列{性别、吸烟}观察分为四组:男性吸烟者,男性不抽烟的人,女性吸烟者,女不抽烟的人。

例子:{性别、吸烟}

数据类型:分类|逻辑|||字符|字符串|细胞

名称-值参数

指定可选的逗号分隔条名称,值参数。的名字参数名称和吗价值相应的价值。的名字必须出现在引号。您可以指定几个名称和值对参数在任何顺序Name1, Value1,…,的家

例子:fitdist (x,“仁”,“仁”,“三角形”)适合一个内核分配对象中的数据x使用一个三角形的内核函数。

审查数据的逻辑信号,指定为一个向量的逻辑值是相同的大小作为输入向量x。这个值是1当相应的元素x是right-censored观察和0当相应的元素是一个精确的观察。默认是一个向量的0年代,表明所有的观察都是恰当的。

fitdist忽略任何一个这个审查向量中的值。此外,任何x或频率向量的原因fitdist忽略相应的审查向量中的值。

这个论点是有效的前提distname“BirnbaumSaunders”,“毛刺”,“指数”,“ExtremeValue”,“伽马”,“InverseGaussian”,“内核”,“物流”,“Loglogistic”,对数正态的,“Nakagami”,“正常”,“Rician”,“tLocationScale”,或“威布尔”

数据类型:逻辑

观察频率,指定为一个向量的非负整数的值是相同的大小作为输入向量x。频率向量的每个元素指定的频率对应的元素x。默认是一个向量的1年代,表明每个值x只出现一次。

fitdist忽略任何一个在这个频率值向量。此外,任何x或审查向量的原因fitdist忽略相应的频率向量中的值。

数据类型:|

迭代匹配算法的控制参数,指定为您创建一个结构使用statset

数据类型:结构体

二项分布的试验数量,指定为一个正整数的值。

这个论点是有效的只有当distname“二”(二项分布)。

例子:“Ntrials”, 10

数据类型:|

位置(阈值)为广义帕累托分布参数,指定为一个标量。

这个论点是有效的只有当distname广义帕累托的(广义帕累托分布)。

样本数据的默认值是0x只包括非负价值。您必须指定θ如果x包括负值。

例子:“θ”,1

数据类型:|

half-normal分布位置参数,指定为一个标量。

这个论点是有效的只有当distname“正常”的一半(half-normal分布)。

样本数据的默认值是0x只包括非负价值。您必须指定μ如果x包括负值。

例子:“亩”,1

数据类型:|

内核平滑类型内核分配,指定为以下之一:

  • “正常”

  • “盒子”

  • “三角形”

  • “epanechnikov”

您必须指定distname作为“内核”使用这个选项。

内核支持内核密度分布,指定为金宝app“无限”,“积极”或双元素向量。

价值 描述
“无限” 密度可以扩展到整个实线。
“积极” 密度是局限于积极的价值观。

此外,您可以指定一个双元素向量给有限的上下极限密度的支持。金宝app

您必须指定distname作为“内核”使用这个选项。

数据类型:||字符|字符串

内核的带宽平滑窗口内核分配,指定为一个标量值。使用的默认值fitdist最佳估算正常密度,但您可能想要选择一个较小的值显示特性,比如多个模式。您必须指定distname作为“内核”使用这个选项。

数据类型:|

输出参数

全部折叠

概率分布,作为一个概率分布对象返回。指定的分布distname确定返回的概率分布的类类型对象。的列表distname值和相应的概率分布对象,明白了distname

概率分布的对象指定的类型distname,作为一个细胞返回数组。的列表distname值和相应的概率分布对象,明白了distname

组标签,作为特征向量的单元阵列返回。

分组变量的水平,作为细胞返回数组的性格为每个分组变量向量包含一个列。

算法

fitdist使用最大似然估计函数符合大多数发行版。两个例外与未经审查的数据是正常和对数正态分布。

  • 未经审查的正态分布,估计σ值参数是根方差的无偏估计。

  • 未经审查的对数正态分布,估计σ值参数无偏估计的方差的平方根的日志数据。

选择功能

  • 分布更健康应用程序打开一个图形用户界面从工作区导入数据,并交互式地对你适合这些数据的概率分布。然后您可以节省工作空间的分布作为概率分布对象。打开分布健康应用程序使用distributionFitter或单击应用程序选项卡上的分布更健康。

  • 适合left-censored分布,double-censored,或结局数据,使用大中型企业。你可以找到使用的最大似然估计大中型企业概率分布函数,并创建一个对象使用makedist函数。例如,看到的找到毫升Double-Censored数据

引用

[1]约翰逊:L。,S. Kotz, and N. Balakrishnan.连续单变量分布。1卷,霍博肯,新泽西:Wiley-Interscience, 1993年。

[2]约翰逊:L。,S. Kotz, and N. Balakrishnan.连续单变量分布。2卷,霍博肯,新泽西:Wiley-Interscience, 1994年。

[3]鲍曼,a·W。,A. Azzalini.应用平滑技术进行数据分析。纽约:牛津大学出版社,1997年版。

扩展功能

介绍了R2009a