文档

glmfit

广义线性模型回归

语法

b = glmfit (X, y,分配)
b = glmfit (X, y,分配,param1,val1,param2,val2,……)
[b, dev] = glmfit (…)
[b, dev,统计]= glmfit (…)

描述

b = glmfit (X, y,分配)返回一个(p+ 1)1的向量b广义线性回归系数估计的反应y在预测X,使用分布分配X是一个n——- - - - - -p矩阵的p预测在每个n观察。分配可以有下列:“二”,“伽马”,逆高斯分布的,“正常”(默认),“泊松”

在大多数情况下,y是一个n1矢量观察到的反应。二项分布,y可以是一个二进制向量在每个观察指示成功或失败,或两列矩阵的第一列显示成功的数量为每个观察和第二列显示的数量为每个观测试验。

这个语法使用规范的链接(见下文)与分布预测。

    注意:默认情况下,glmfit增加了1 s的第一列X在模型中,对应于一个常数项。不输入列1 s直接进入吗X。您可以更改默认的行为glmfit使用“不变”下面的参数。

glmfit对待年代在Xy作为缺失值,忽略了它们。

b = glmfit (X, y,分配,param1,val1,param2,val2,……)此外允许您指定可选参数名称/值对控制模型。可接受的参数如下。

参数 价值 描述
“链接”

“身份”,默认的分布“正常”

µ=Xb

“日志”,默认的分布“泊松”

日志(µ)=Xb

分对数的,默认的分布“二”

日志(µ/ (1 -µ))=Xb

“probit”

norminv (µ)=Xb

“comploglog”

日志(日志(1 -µ))=Xb

“互惠”,默认的分布“伽马”

1 /µ=Xb

“重对数”

日志(日志(µ))=Xb

p(数量),默认的分布逆高斯分布的(与p= 2)

µp=Xb

单元阵列的形式{FL FD FI},包含三个功能处理,使用创建的@定义链接(FL的导数),链接(FD)和反向链接(FI)。

自定义链接功能。你必须提供

  • FL(亩)

  • FD =(μ)/ dmu阐述

  • FI = FL ^ (1)

结构数组有这些字段:

  • “链接”——链接功能

  • “衍生品”——链接函数的导数

  • “逆”——反向链接的功能

每个字段的值是一个特征向量对应一个函数,在路径或一个函数处理(创建使用@)。

自定义链接功能,它的导数,它的逆矩阵。
“estdisp” “上”

色散参数估计的二项或泊松分布。

“关闭”(默认为二项或泊松分布)

使用这些分布的理论值为1.0。

“抵消”

向量

作为一个额外的预测变量,但系数值固定在1.0。

“重量”

向量的权重之前,如每个观测的相对方差的倒数

“不变”

“上”(默认)

包括一个模型中的常数项。常数项的系数的第一个元素b

“关闭”

省略了常数项。

[b, dev] = glmfit (…)返回dev,异常向量适合的解决方案。异常是一个泛化的残差平方和。可以执行异常的分析比较几种模型,每个其他的一个子集,并测试该模型是否更方面明显优于模型用更少的条件。

[b, dev,统计]= glmfit (…)返回dev统计数据

统计数据是一种结构与以下字段:

  • β——系数估计b

  • 教育部——自由度误差

  • sfit——估计色散参数

  • 年代——理论或色散参数估计

  • estdisp- 0时,“estdisp”名称-值对参数值“关闭”和1的时候“estdisp”名称-值对参数值“上”

  • covb——估计协方差矩阵B

  • se——向量系数估计的标准误差b

  • coeffcorr——相关矩阵b

  • t- - - - - -t统计数据b

  • p- - - - - -p值为b

  • 渣油向量的残差

  • residp——培生残差向量

  • residd——异常残差向量

  • resida——安斯科姆残差向量

如果你估计色散参数为二项或泊松分布,stats.s设置等于stats.sfit。同时,的元素stats.se不同的因素stats.s从他们的理论价值。

例子

全部折叠

输入样本数据。

x = (2100 2300 2500 2700 2900 31003300 3500 3700 3900 4100 4300);n =[48 42 31 34 31日21日23日23日21日16 17 21)';y =[1 2 0 3 8 8 14 17日19日15日17日21日)';

每一个y价值是成功的数量在相应数量的试验n,x包含预测变量的值。

适合的概率单位回归模型yx

b = glmfit (x, y [n],“二”,“链接”,“probit”);

计算估计数量的成功和情节百分比观察和估计百分比与成功x值。

yfit = glmval (b, x,“probit”,“大小”n);情节(x, y / n,“o”,x, yfit. / n,“- - -”,“线宽”,2)

加载示例数据。

负载fisheriris

列向量,物种,包括虹膜花三个不同的物种,setosa, virginica杂色的。双矩阵包括四种类型的测量上的鲜花,在厘米萼片和花瓣的长度和宽度,分别。

定义响应和预测变量。

X =量(51:最终,);y = strcmp (“多色的”、物种(51:结束));

定义三个函数处理,使用创建的@的导数定义链接,链接,和分对数的反向链接链接功能,并将它们存储在一个单元阵列。

链接= @(μ)日志(μ。/(1μ));derlink = @(μ)1。/(μ。*(1μ));invlink = @(职责)1。/ (1 + exp(职责));F ={链接、derlink invlink};

适合使用逻辑回归glmfit与函数定义的链接。

b = glmfit (X, y,“二”,“链接”F)
b = 42.6378 2.4652 6.6809 -9.4294 -18.2861

现在,符合广义线性模型使用分对数链接功能和比较结果。

b = glmfit (X, y,“二”,“链接”,分对数的)
b = 42.6378 2.4652 6.6809 -9.4294 -18.2861

引用

[1]多布森,a·J。介绍了广义线性模型。纽约:查普曼&大厅,1990。

[2]McCullagh, P。,J. A. Nelder.广义线性模型。纽约:查普曼&大厅,1990。

[3]Collett D。二进制数据建模。纽约:查普曼&大厅,2002。

之前介绍过的R2006a

这个主题有帮助吗?