带形状参数的广义帕累托分布的概率密度函数k≠0规模参数σ,阈值参数θ,是
为θ<x,当k> 0,或forθ<x<θ- - - - - -σ/k当k< 0。
为k= 0时,密度为
为θ<x。
如果k= 0和θ= 0时,广义帕累托分布等价于指数分布。如果k> 0,θ=σ/k,广义帕累托分布等价于尺度参数为的帕累托分布σ/k一个形状参数等于1 /k。
像指数分布一样,广义帕累托分布也经常被用来建模另一种分布的尾部。例如,您可能在生产过程中使用了垫圈。如果过程中的随机影响导致垫圈尺寸的差异,一个标准概率分布,例如正态分布,可以用来对这些尺寸建模。然而,虽然正态分布在其模态附近可能是一个很好的模型,但它可能不能很好地适应尾部的真实数据,可能需要一个更复杂的模型来描述数据的全部范围。另一方面,只记录大于(或小于)某个阈值的垫圈的尺寸意味着您可以将一个单独的模型用于那些尾部数据,这就是所谓的超过数点。您可以这样使用广义帕累托分布,为极端复杂数据提供良好的拟合。
广义帕累托分布允许一个连续的可能形状范围,包括指数分布和帕累托分布作为特例。您可以使用这些发行版中的任何一个来为特定的超越数据集建模。广义帕累托分布允许你“让数据来决定”哪种分布是合适的。
广义帕累托分布有三种基本形式,每一种对应于来自不同类型基础分布的超越数据的极限分布。
尾巴呈指数递减的分布,如正态分布,会导致广义帕累托形参数为零。
尾部以多项式形式减小的分布,例如学生的t,得到一个正的形状参数。
尾巴是有限的分布,例如,导致一个负的形状参数。
分布拟合对象的尾部采用了广义帕累托分布paretotails
对象。
如果你从一个学生的随机值中生成大量的随机值t5个自由度的分布,然后去掉所有小于2的,你可以用一个广义帕累托分布来满足这些极限。
rng默认的%的再现性t = trnd (5000 1);y = t(t > 2) - 2;paramEsts = gpfit (y)
paramEsts =1×20.1445 - 0.7225
注意,形状参数估计数(第一个元素)是正的,这是您根据学生的超出数所期望的结果t分布。
嘘(y + 2, 2.25: .5:11.75);h = findobj (gca),“类型”,“补丁”);h.FaceColor =[。8。8 1];xgrid = linspace (2, 1000);行(xgrid, 5 *长度(y) *…gppdf (xgrid paramEsts (1) paramEsts (2), 2));
计算三个广义帕累托分布的pdf。第一个有形状参数k = -0.25
,第二个有k = 0
,第三个已经有了k = 1
。
x = linspace (0, 1000);日元= gppdf (x, 15年,1,0);y2 = gppdf (x, 0 1 0);y3 = gppdf (x, 1 1 0);
在同一个图形上画出三个pdf文件。
图;情节(x, y₁,“- - -”, x, y2,“——”, x, y3,“:”)({传奇“K < 0”“K = 0”“K > 0”});
[1] Embrechts, P., C. Klüppelberg和T. Mikosch。为保险和金融建模极值事件。纽约:施普林格,1997。
Kotz, S.和S. Nadarajah。极值分布:理论与应用。伦敦:帝国理工学院出版社,2000。