主要内容

负二项分布

定义

r参数是一个整数,负二项pdf

y = f ( x | r , p ) = ( r + x 1 x ) p r x ( 0 , 1 , ) ( x )

在哪里= 1 -p。当r不是一个整数,二项式系数在pdf的定义是等价的表达式所取代

Γ ( r + x ) Γ ( r ) Γ ( x + 1 )

背景

在其最简单的形式(当r是一个整数),负二项分布模型失败的数量x之前指定数量的成功达成的一系列独立的,相同的试验。它的参数是在一个试验中,成功的概率p成功的数量,r。负二项分布的一个特例,当r= 1,是几何分布,该模型在第一个成功之前失败的数量。

更普遍的是,r可以承担非整数的值。这种形式的负二项分布没有重复试验的诠释,但是,就像泊松分布在建模统计数据,它是有用的。负二项分布比泊松分布更普遍,因为它有一个大于其均值的方差,使它适合统计数据不符合泊松分布的假设。在极限情况下,r增加到正无穷,泊松分布的负二项分布的方法。

参数

负二项分布参数

确定负二项分布的参数。

假设你是收集数据的数量汽车事故在一条繁忙的高速公路,并希望能够每天事故的数量模型。因为这些是统计数据,因为有大量的汽车和一个小事故的概率为任何特定的车,你可能会想使用泊松分布。然而,事故的概率可能会一天比一天不同天气和流量的变化,所以假设所需的泊松分布并不满足。特别是,这种类型的统计数据的方差有时超过了大量的意思。下面的数据表现出这种效果:大多数日子里有很少或根本没有事故,几天有大量。

事故=[2 3 4 2 3 1 12 8 14日31日23 1 10 7 0];m =意味着(事故)
m = 8.0667
v = var(事故)
v = 79.3524

负二项分布比泊松,更一般的,往往是适合当泊松不计数数据。这个函数nbinfit返回最大似然(ml)估计和置信区间为负二项分布的参数。观察结果的拟合事故数据。

(太好了,pci) = nbinfit(事故)
太好了=1×21.0060 - 0.1109
pci =2×20.2152 0.0171 1.7968 0.2046

很难给出一个物理解释在这种情况下个人参数。然而,估计的参数可用于日常事故的典范。例如,一块估计累积概率函数表明,虽然估计有10%的机会没有事故在给定的一天,也有大约10%的机会将会有20个或更多的事故。

情节(0:50 nbincdf(0:50酷毙了(1),太好了(2)),“。”);包含(每天“事故”)ylabel (“累积概率”)

图包含一个坐标轴对象。每天坐标轴对象包含事故,ylabel累积概率包含一个类型的对象。

例子

计算和负二项分布的pdf

计算和绘制pdf使用四个不同的参数值r成功的所需数量:。1,1,3,6。在每种情况下,成功的概率p。5

x = 0:10;情节(x, nbinpdf (x。1。5),“s -”,x, nbinpdf (x 1。5),“啊——”,x, nbinpdf (x 3。5),“d -”,x, nbinpdf (x 6。5),' ^ - ');传奇({' r = 1。“r = 1”' r = 3 '' r = 6})包含(“x”)ylabel (“f (x | r p)”)

图包含一个坐标轴对象。坐标轴对象包含x, ylabel f (x | r p)包含4线类型的对象。这些对象代表r = 1, r = 1, r = 3, r = 6。

情节表明,负二项分布可以承担各种形状,从非常接近对称倾斜,这取决于的价值r

另请参阅

相关的话题