主要内容

适合帕累托尾部的非参数分布

此示例显示如何使用Pareto Teats将非参数概率分布适合对数据进行采样,以平滑尾部的分布。

步骤1.生成示例数据。

生成包含更多异常的异常值的示例数据,从标准正态分布中预期。

RNG('默认'重复性的%left_tail = -exprnd(1,10,1);Right_tail = Exprnd(5,10,1);中心= Randn(80,1);data = [left_tail;中心; right_tail];

数据包含标准正态分布的80%值,从指数分布的均值为5%,均值为-1的指数分布,10%。与标准的正态分布相比,指数值更可能是异常值,特别是在上部尾部。

步骤2.适用于数据的概率分布。

适合正态分布和一个T.位置级分布到数据,以及视觉比较的曲线。

probplot(数据);p = fitdist(数据,'tlocationscale');h = probplot(gca,p);套(H,'颜色''r''linestyle'' - ');标题('概率绘图')传奇('正常''数据''t位置级''地点''se'

两个分布似乎都在中心合理地适合,但既不是正常分布也不是T.位置级分配非常适合尾部。

步骤3.生成经验分布。

获得更好的合适,使用ecdf.基于样本数据生成经验CDF。

图ECDF(数据)

实证分布提供了完美的契合,但异常值使尾部非常离散。使用反转方法的来自该分布产生的随机样本可以包括例如近4.33和9.25附近的值,但之间没有值。

步骤4.使用帕累托尾部配合分布。

利用Paretotails.为了为中间80%的数据产生经验CDF,并将广义帕吻曲面分布到下10%。

pfit = paretotails(数据,0.1,0.9)
PFIT =带有3个SEGMENTS的分段分布-INF 
              

获得更好的合适,Paretotails.通过在样本中心拼接ECDF或内核分布,并在尾部中平滑通用帕匹官分布(GPDS)来拟合分布。利用Paretotails.去创造Paretotails.概率分布对象。您可以访问有关适合的信息,并使用对象对对象进行进一步计算Paretotails.目的。例如,您可以评估CDF或从分发中生成随机数。

步骤5.计算和绘制CDF。

计算并绘制安装的CDFParetotails.分配。

x = -4:0.01:10;plot(x,cdf(pfit,x))

Paretotails.CDF与数据密切合适,但在尾部比在步骤3中产生的ECDF更平滑。

也可以看看

||

相关话题