拟合概率分布对象与数据
对样本数据拟合正态分布,并使用直方图和分位数图检查拟合情况。
从数据文件加载患者权重病人垫
.
负载病人x =重量;
通过将正态分布对象拟合到数据来创建正态分布对象。
pd=fitdist(x,“正常”)
pd=正态分布正态分布mu=154[148.728159.272]σ=26.5714[23.3299,30.8674]
分布对象显示包括平均值的参数估计(亩
)及标准偏差(σ
),以及参数的95%置信区间。
的对象函数pd
来评估分布并生成随机数。显示支持的对象函数。金宝app
方法(pd)
类概率正态分布的方法:cdf iqr negloglik proflik截断聚集平均参数随机变量icdf中值pdf标准
例如,通过使用帕拉姆奇
函数。
ci95=参数CI(pd)
ci95 =2×2148.7277 23.3299 159.2723 30.8674
指定显著性水平(阿尔法
)获取具有不同置信水平的置信区间。计算99%的置信区间。
ci99 = paramci (pd,“阿尔法”,.01)
ci99=2×2147.0213 22.4257 160.9787 32.4182
计算并绘制分布的pdf值。
x_值=50:1:250;y=pdf(pd,x_值);绘图(x_值,y)
创建一个直方图与正态分布拟合使用histfit
函数。histfit
使用fitdist
使分布适合数据。
histfit (x)
直方图显示数据有两种模态,正态分布拟合的模态在这两种模态之间。
使用qqplot
创建样本数据分位数的分位数图x
相对于拟合分布的理论分位数值。
qqplot(x,pd)
曲线不是一条直线,说明数据不是正态分布。
从数据文件加载患者权重病人垫
.
负载病人x =重量;
通过将内核分发对象与数据相匹配来创建它。使用Epanechnikov内核函数。
pd=fitdist(x,“内核”,“内核”,“epanechnikov”)
pd=KernelDistribution内核=epanechnikov带宽=14.3792支持度=无界金宝app
绘制分布图的pdf。
x_值=50:1:250;y=pdf(pd,x_值);绘图(x_值,y)
从数据文件加载患者体重和性别病人垫
.
负载病人x =重量;
通过对数据进行拟合,创建正态分布对象,按患者性别分组。
(pdca gn, gl) = fitdist (x,“正常”,“由”,性别)
pdca =1×2单元阵列{1 x1概率。NormalDistribution} {1 x1概率。NormalDistribution}
gn =2x1电池{“男性”}{‘女性’}
gl =2x1电池{“男性”}{‘女性’}
细胞数组pdca
包含两个概率分布对象,每个性别组一个。细胞数组gn
包含两个组标签。细胞数组gl
包含两个组级别。
查看单元格数组中的每个分布pdca
要比较平均值,亩
,标准差,σ
,按病人性别分组。
女性=pdca{1}%女性分布情况
女性=正态分布正态分布mu=180.532[177.833183.231]西格玛=9.19322[7.63933,11.5466]
男= pdca {2}%男性的分布
男性=正态分布正态分布mu=130.472[128.183,132.76]西格玛=8.30339[6.96947,10.2736]
计算每个分发版的pdf。
x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);
绘制pdf文件以直观地比较性别的体重分布。
图绘制(x_values femalepdf,“线宽”, 2)在…上绘图(x_值,PDF,“颜色”,“r”,“线型”,':',“线宽”2)传说(gn,“位置”,“东北”)持有关
从数据文件加载患者体重和性别病人垫
.
负载病人x =重量;
通过将核心分布对象与按患者性别分组的数据相匹配来创建它们。使用三角核函数。
(pdca gn, gl) = fitdist (x,“内核”,“由”性别“内核”,“三角形”);
查看单元格数组中的每个分布pdca
查看每种性别的内核发行版。
女性=pdca{1}%女性分布情况
女性=内核分布内核=三角形带宽=5.08961支持=无限金宝app
男= pdca {2}%男性的分布
男性=内核分布内核=三角形带宽=4.25894支持=无限金宝app
计算每个分发版的pdf。
x_values = 50:1:250;femalepdf = pdf(女,x_values);malepdf = pdf(男,x_values);
绘制pdf文件以直观地比较性别的体重分布。
图绘制(x_values femalepdf,“线宽”, 2)在…上绘图(x_值,PDF,“颜色”,“r”,“线型”,':',“线宽”2)传说(gn,“位置”,“东北”)持有关
x
- - - - - -输入数据输入数据,指定为列向量。fitdist
忽略了南
价值观x
.此外,任何南
值在截尾矢量或频率矢量引起fitdist
中对应的值忽略x
.
数据类型:双
distname
- - - - - -分发名称分布名称,指定为以下字符向量或字符串标量之一。由distname
确定返回的概率分布对象的类型。
分发名称 | 描述 | 分布对象 |
---|---|---|
“贝塔” |
贝塔分布 | β分布 |
“二” |
二项分布 | BinomialDistribution |
“BirnbaumSaunders” |
Birnbaum-Saunders分布 | 伯恩鲍姆萨分布 |
“伯尔” |
毛刺分布 | BurrDistribution |
“指数” |
指数分布 | 指数分布 |
“极值” 或“电动汽车” |
极值分布 | ExtremeValueDistribution |
“伽马” |
伽马分布 | GammaDistribution |
“广义极值” 或“gev” |
广义极值分布 | 广义右旋分布 |
广义帕累托的 或“gp” |
广义帕累托分布 | 广义分布 |
“半正常” 或“嗯” |
Half-normal分布 | HalfNormalDistribution |
“InverseGaussian” |
逆高斯分布 | 逆高斯分布 |
“内核” |
内核分配 | KernelDistribution |
“物流” |
物流配送 | LogisticDistribution |
“后勤” |
Loglogistic分布 | LoglogisticDistribution |
对数正态的 |
对数正态分布 | 对数正态分布 |
“中谷” |
中川分布 | NakagamiDistribution |
“负二项” 或“nbin” |
负二项分布 | NegativeBinomialDistribution |
“正常” |
正态分布 | 常态分配 |
“泊松” |
泊松分布 | 泊松分布 |
“瑞利” |
瑞利分布 | RayleighDistribution |
“Rician” |
蓖麻分布 | 分布 |
“稳定” |
稳定分布 | StableDistribution |
“tLocationScale” |
tLocation-Scale分布 | tLocationScaleDistribution |
“威布尔” 或“wbl” |
威布尔分布 | WeibullDistribution |
群变
- - - - - -分组变量分组变量,指定为分类数组、逻辑或数字向量、字符数组、字符串数组或字符向量的单元格数组。分组变量中的每个唯一值定义一个组。
例如,如果性别
字符向量的单元格数组有值吗“男性”
和“女性”
,你可以使用性别
作为分组变量,以符合你的数据的性别分布。
通过指定分组变量的单元格数组,可以使用多个分组变量。如果观测值具有所有指定分组变量的公共值,则将它们放置在同一组中。
例如,如果吸烟者
是具有值的逻辑向量0
对于不吸烟者和1
对于吸烟者,则指定单元格数组{性别,吸烟者}
将观察分为四组:男性吸烟者、男性不吸烟者、女性吸烟者和女性不吸烟者。
例子:{性别,吸烟者}
数据类型:分类
|逻辑
|仅有一个的
|双
|字符
|一串
|单间牢房
指定可选的逗号分隔的对名称、值
参数。名称
参数名和价值
是对应的值。名称
必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:Name1, Value1,…,的家
.
fitdist(x,'Kernel','Kernel','triangle')
中的数据拟合内核分布对象x
用三角核函数。
审查
- - - - - -删失数据的逻辑标志0
(默认)|逻辑值向量审查数据的逻辑标志,指定为与输入向量大小相同的逻辑值向量x
. 价值是1
当相应的元素x
这是一个经过右删失的观察结果0
当对应的元素是一个精确的观测值时。默认值是一个向量0
S,表明所有的观测结果都是准确的。
fitdist
忽略任何南
此审查向量中的值。此外,任何南
价值观x
或者是频率矢量引起的fitdist
忽略截尾向量中的相应值。
此参数仅在以下情况下有效:distname
是“BirnbaumSaunders”
,“伯尔”
,“指数”
,“极端价值”
,“伽马”
,“InverseGaussian”
,“内核”
,“物流”
,“后勤”
,对数正态的
,“中谷”
,“正常”
,“Rician”
,“tLocationScale”
或“威布尔”
.
数据类型:逻辑
频率
- - - - - -观察频率1
(默认)|非负整数值向量观察频率,指定为与输入向量大小相同的非负整数值向量x
. 频率向量的每个元素指定中对应元素的频率x
. 默认值是一个向量1
S,表示中每个值x
只出现一次。
fitdist
忽略任何南
此频率向量中的值。此外,任何南
价值观x
或者是截尾矢量原因fitdist
忽略频率向量中的相应值。
数据类型:仅有一个的
|双
选择权
- - - - - -控制参数迭代拟合算法的控制参数,指定为使用statset
.
数据类型:结构
中心线
- - - - - -二项分布的试验次数内核
- - - - - -核分布的核平滑器类型“正常”
(默认)|“盒子”
|“三角形”
|“epanechnikov”
金宝app
- - - - - -内核分布的内核密度支持金宝app“无限的”
(默认)|“肯定的”
|二元向量内核分布的内核密度支持,指定为金宝app“无限的”
,“肯定的”
,或双元素向量。
价值 | 描述 |
---|---|
“无限的” |
密度可以延伸到整条实线。 |
“肯定的” |
密度限制为正值。 |
或者,您可以指定一个二元向量,为密度的支持提供有限的下限和上限。金宝app
您必须指定distname
作为“内核”
使用此选项。
数据类型:仅有一个的
|双
|字符
|一串
宽度
- - - - - -核分布平滑窗的带宽内核分布的内核平滑窗口的带宽,指定为标量值。默认值由fitdist
对于估计正常密度是最佳的,但您可能希望选择较小的值来显示特征,例如多个模式。您必须指定distname
作为“内核”
使用此选项。
数据类型:仅有一个的
|双
的fitdist
函数使用最大似然估计拟合大多数分布。两个例外情况是未经审查数据的正态分布和对数正态分布。
对于无偏正态分布,σ参数的估计值是方差无偏估计的平方根。
对于未经检验的对数正态分布,西格玛参数的估计值是数据对数方差无偏估计的平方根。
的分配装配工应用程序打开一个图形用户界面,供您从工作区导入数据,并以交互方式将概率分布拟合到该数据。然后,您可以将概率分布保存到工作区作为概率分布对象。使用distributionFitter
,或单击“应用程序”选项卡上的“分发安装程序”。
若要拟合左截、双截或间隔截数据的分布,请使用最大似然误差
。您可以使用最大似然误差
函数,并使用制造者
函数。例如,请参见求双截尾数据的MLEs.
[1] 约翰逊,N.L.,S.Kotz和N.Balakrishnan。连续单变量分布第1卷,新泽西州霍博肯:威利国际科学出版社,1993年。
[2] 约翰逊,N.L.,S.Kotz和N.Balakrishnan。连续单变量分布.第2卷,霍博肯,新泽西州:威利-国际科学,1994。
[3] 鲍曼、A.W.和A.Azzalini。数据分析中应用的平滑技术.纽约:牛津大学出版社,1997。
使用注意事项及限制:
金宝app支持的语法包括:
pd
=fitdist(x
,distname
)pd
=fitdist(x
,distname
,名称、值
)
“通过”,groupvar
以及相关的输出参数pdca
,gn
和gl
.fitdist
金宝app支持生成beta、指数、极值、对数正态、正态和Weibull分布的代码。
价值distname
可以“贝塔”
,“指数”
,“极端价值”
,对数正态的
,“正常”
或“威布尔”
.
价值distname
必须是编译时常量。
的值x
,“审查”
和“频率”
不得包含南
价值观
代码生成忽略“频率”
beta分布的值。而不是指定“频率”
值,手动添加重复值x
所以值在里面x
有你想要的频率。
代码生成不支持以下输入参数:金宝app群变
,中心线
,西塔
,亩
,内核
,金宝app
和宽度
.
名称-值对参数中的名称必须是编译时常量。
有关代码生成的更多信息,请参见代码生成简介和概率分布对象的代码生成.
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
您还可以从以下列表中选择网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。