负二项分布
定义
当r参数是一个整数,负二项pdf
在哪里问= 1 -p。当r不是一个整数,二项式系数在pdf的定义是等价的表达式所取代
背景
在其最简单的形式(当r是一个整数),负二项分布模型失败的数量x之前指定数量的成功达成的一系列独立的,相同的试验。它的参数是在一个试验中,成功的概率p成功的数量,r。负二项分布的一个特例,当r= 1,是几何分布,该模型在第一个成功之前失败的数量。
更普遍的是,r可以承担非整数的值。这种形式的负二项分布没有重复试验的诠释,但是,就像泊松分布在建模统计数据,它是有用的。负二项分布比泊松分布更普遍,因为它有一个大于其均值的方差,使它适合统计数据不符合泊松分布的假设。在极限情况下,r增加到正无穷,泊松分布的负二项分布的方法。
参数
负二项分布参数
确定负二项分布的参数。
假设你是收集数据的数量汽车事故在一条繁忙的高速公路,并希望能够每天事故的数量模型。因为这些是统计数据,因为有大量的汽车和一个小事故的概率为任何特定的车,你可能会想使用泊松分布。然而,事故的概率可能会一天比一天不同天气和流量的变化,所以假设所需的泊松分布并不满足。特别是,这种类型的统计数据的方差有时超过了大量的意思。下面的数据表现出这种效果:大多数日子里有很少或根本没有事故,几天有大量。
事故=[2 3 4 2 3 1 12 8 14日31日23 1 10 7 0];m =意味着(事故)
m = 8.0667
v = var(事故)
v = 79.3524
负二项分布比泊松,更一般的,往往是适合当泊松不计数数据。这个函数nbinfit
返回最大似然(ml)估计和置信区间为负二项分布的参数。观察结果的拟合事故
数据。
(太好了,pci) = nbinfit(事故)
太好了=1×21.0060 - 0.1109
pci =2×20.2152 0.0171 1.7968 0.2046
很难给出一个物理解释在这种情况下个人参数。然而,估计的参数可用于日常事故的典范。例如,一块估计累积概率函数表明,虽然估计有10%的机会没有事故在给定的一天,也有大约10%的机会将会有20个或更多的事故。
情节(0:50 nbincdf(0:50酷毙了(1),太好了(2)),“。”);包含(每天“事故”)ylabel (“累积概率”)
例子
计算和负二项分布的pdf
计算和绘制pdf使用四个不同的参数值r
成功的所需数量:。1
,1
,3
,6
。在每种情况下,成功的概率p
是。5
。
x = 0:10;情节(x, nbinpdf (x。1。5),“s -”,…x, nbinpdf (x 1。5),“啊——”,…x, nbinpdf (x 3。5),“d -”,…x, nbinpdf (x 6。5),' ^ - ');传奇({' r = 1。“r = 1”' r = 3 '' r = 6})包含(“x”)ylabel (“f (x | r p)”)
情节表明,负二项分布可以承担各种形状,从非常接近对称倾斜,这取决于的价值r
。