适合帕累托尾部的非参数分布

打开直播脚本

此示例显示如何使用Pareto Teats将非参数概率分布适合对数据进行采样，以平滑尾部的分布。

步骤1.生成示例数据。

生成包含更多异常的异常值的示例数据，从标准正态分布中预期。

RNG（'默认'）重复性的％left_tail = -exprnd（1,10,1）;Right_tail = Exprnd（5,10,1）;中心= Randn（80,1）;data = [left_tail;中心; right_tail];

数据包含标准正态分布的80％值，从指数分布的均值为5％，均值为-1的指数分布，10％。与标准的正态分布相比，指数值更可能是异常值，特别是在上部尾部。

步骤2.适用于数据的概率分布。

适合正态分布和一个T.位置级分布到数据，以及视觉比较的曲线。

probplot（数据）;p = fitdist（数据，'tlocationscale'）;h = probplot（gca，p）;套（H，'颜色'那'r'那'linestyle'那' - '）;标题（'概率绘图'）传奇（'正常'那'数据'那't位置级'那'地点'那'se'）

两个分布似乎都在中心合理地适合，但既不是正常分布也不是T.位置级分配非常适合尾部。

步骤3.生成经验分布。

获得更好的合适，使用ecdf.基于样本数据生成经验CDF。

图ECDF（数据）

实证分布提供了完美的契合，但异常值使尾部非常离散。使用反转方法的来自该分布产生的随机样本可以包括例如近4.33和9.25附近的值，但之间没有值。

步骤4.使用帕累托尾部配合分布。

利用Paretotails.为了为中间80％的数据产生经验CDF，并将广义帕吻曲面分布到下10％。

pfit = paretotails（数据，0.1,0.9）

PFIT =带有3个SEGMENTS的分段分布-INF

获得更好的合适，Paretotails.通过在样本中心拼接ECDF或内核分布，并在尾部中平滑通用帕匹官分布（GPDS）来拟合分布。利用Paretotails.去创造Paretotails.概率分布对象。您可以访问有关适合的信息，并使用对象对对象进行进一步计算Paretotails.目的。例如，您可以评估CDF或从分发中生成随机数。

步骤5.计算和绘制CDF。

计算并绘制安装的CDFParetotails.分配。

x = -4：0.01：10;plot（x，cdf（pfit，x））

该Paretotails.CDF与数据密切合适，但在尾部比在步骤3中产生的ECDF更平滑。

也可以看看

ecdf.|Fitdist.|Paretotails.

统计和机器学习工具箱文档

金宝app

掌握机器学习：使用MATLAB逐步指南

下载电子书