主要内容

负二项分布

定义

r参数为整数,则负二项式PDF为

y f x | r p r + x 1 x p r x 0 1 ... x

在哪里= 1 -p.当r如果不是整数,则PDF定义中的二项式系数被等效表达式

Γ r + x Γ r Γ x + 1

背景

最简单的形式是r是整数),负二项分布模型的失败次数x在一系列独立的、相同的试验达到一定数量的成功之前。它的参数是一次试验成功的概率,p,以及成功的次数,r.负二项分布的一种特殊情况r= 1,为几何分布,它模拟了第一次成功之前的失败次数。

更普遍的是,r可以取非整数值。这种形式的负二项分布没有重复试验的解释,但就像泊松分布,它在建模计数数据时很有用。负二项分布比泊松分布更一般,因为它的方差大于均值,使它适合于不满足泊松分布假设的计数数据。在极限,如r时,负二项分布趋近于泊松分布。

参数

假设您正在收集关于繁忙高速公路上的汽车事故数量的数据,并希望能够对每天的事故数量进行建模。因为这些是计数数据,而且对于任何一辆特定的车来说都有很大数量的车发生事故的概率很小,你可能会想到使用泊松分布。然而,发生事故的概率可能会随着天气和交通量的变化而变化,因此泊松分布所需要的假设是不满足的。特别是,这类计数数据的方差有时会大大超过均值。下面的数据显示了这种影响:大多数日子很少或没有事故,而有几天有大量的事故。

Accident = [2 3 4 23 1 12 8 14 31 23 1 10 7 0];m =意味着(事故)
m = 8.0667
v = var(事故)
v = 79.3524

负二项分布比泊松分布更普遍,当泊松分布不是负二项分布时,常适用于计数数据。这个函数nbinfit返回负二项分布参数的最大似然估计(MLEs)和置信区间。下面是拟合结果事故数据:

(太好了,pci) = nbinfit(事故)
太好了=1×21.0060 - 0.1109
pci =2×20.0171 1.7968 0.2046

在这种情况下,很难对各个参数作出物理上的解释。然而,估计的参数可以用于一个模型的日常事故的数量。例如,一个估计的累积概率函数图显示,在给定的一天中,虽然估计有10%的几率没有事故,但也有10%的几率会发生20起或更多事故。

情节(0:50 nbincdf(0:50酷毙了(1),太好了(2)),“。”);包含(“每天事故”) ylabel (“累积概率”

图中包含一个轴对象。axis对象包含一个类型为line的对象。

例子

计算和绘制负二项分布PDF

使用参数的四个不同值计算并绘制pdfr,所期望的成功次数:.113.,6.在每种情况下,成功的概率p.5

x = 0:10;情节(x, nbinpdf (x。1。5),“s -”...x, nbinpdf (x 1。5),“啊——”...x, nbinpdf (x 3。5),“d -”...x, nbinpdf (x 6。5),' ^ - ');传奇({' r = 1。“r = 1”' r = 3 '' r = 6})包含(“x”) ylabel (“f (x | r p)”

图中包含一个轴对象。轴对象包含4个类型为line的对象。这些对象代表r = 1, r = 1, r = 3, r = 6。

图中显示负二项分布可以呈现出各种形状,从非常倾斜到几乎对称,这取决于的值r

另请参阅

相关的话题