用逐步回归建立广义线性回归模型
广义线性模型mdl
是一个标准的线性模型吗分布
名称-值对。
对于其他方法,例如devianceTest
的属性GeneralizedLinearModel
对象,请参见GeneralizedLinearModel
。
在训练模型之后,您可以生成C/ c++代码来预测对新数据的响应。生成C/ c++代码需要MATLAB编码器™。有关详细信息,请参见代码生成简介。
逐步回归是一种系统方法,用于根据线性或广义线性模型中的术语在解释响应变量时的统计意义,添加和删除这些术语。该方法从使用指定的初始模型开始模型规格
,然后比较逐渐增大和减小的模型的解释能力。
的逐步GLM
函数使用正向和向后逐步回归来确定最终模型。在每个步骤中,该函数搜索要添加到模型中的术语或要从模型中删除的术语“标准”
名称-值对的论点。
的默认值“标准”
对于线性回归模型是上交所的
。在这种情况下,逐步地
和步
的LinearModel
使用p价值的F-统计来测试模型在每个步骤中有或没有潜在的项。如果一项目前不在模型中,则零假设是,如果将该项添加到模型中,其系数将为零。如果有足够的证据拒绝零假设,该函数将该项添加到模型中。相反,如果一项目前在模型中,零假设是该项系数为零。如果没有足够的证据来拒绝原假设,该函数将从模型中删除该术语。
逐步回归采用这些步骤时“标准”
是上交所的
:
适合初始模型。
检查一组不在模型中的可用术语。如果有任何条款p-值小于入口公差(也就是说,如果将一项添加到模型中不太可能有零系数),则添加最小的一项p-value并重复此步骤;否则,请转步骤3。
如果模型中有任何可用的条款p-大于退出公差的值(即,不能拒绝零系数的假设),删除具有最大值的项p-value和返回步骤2;否则,结束该进程。
在任何阶段,如果模型不包括作为高阶项子集的所有低阶项,函数都不会添加高阶项。例如,函数不会尝试添加术语X1, X2 ^ 2
除非两X1
和X2^2
已经在模型中了。类似地,该函数不会删除模型中保留的高阶项子集的低阶项。例如,函数不会尝试删除X1
或X2^2
如果X1, X2 ^ 2
保持在模型中。
的默认值“标准”
对于一个广义线性模型“异常”
。逐步GLM
和步
的GeneralizedLinearModel
按照类似的程序添加或删除术语。
属性可以指定其他条件“标准”
名称-值对的论点。例如,您可以指定Akaike信息标准、贝叶斯信息标准、r平方或调整的r平方的值的更改作为添加或删除项的标准。
根据初始模型中包含的术语以及函数添加和删除术语的顺序,该函数可以从同一组潜在术语构建不同的模型。当没有单个步骤改进模型时,该函数终止。然而,不同的初始模型或不同的步骤序列并不能保证更好的匹配。从这个意义上说,逐步模型是局部最优的,但可能不是全局最优的。
逐步GLM
对分类预测器的处理如下:
一个有绝对预测器的模型l包括水平(类别)l- 1指标变量。模型使用第一个类别作为参考级别,因此不包含参考级别的指标变量。如果分类预测器的数据类型为绝对的
,则可以使用类别
并通过使用reordercats
自定义参考级别。
逐步GLM
对待一组l- 1指示器变量作为一个单独的变量。如果您想将指示器变量视为不同的预测变量,可以使用dummyvar
。然后在拟合模型时,使用除分类变量参考水平对应的指标变量外的其他指标变量。对于绝对预测器X
,如果指定的所有列dummyvar (X)
并以截距项作为预测因子,使设计矩阵秩亏缺。
连续预测器和分类预测器之间的交互项l级别由以下元素的元素级产品组成:l- 1带有连续预测器的指标变量。
两个类别预测因子之间的交互项l和米级别包括(l- 1) * (米– 1)指标变量包括两个分类预测水平的所有可能组合。
不能为绝对预测器指定高阶项,因为指示器的平方等于它本身。
因此,如果逐步GLM
添加或删除一个分类预测器,该函数实际上在一个步骤中添加或删除一组指示器变量。类似地,如果逐步GLM
添加或删除带有类别预测器的交互项,该函数实际添加或删除包含类别预测器的交互项组。
逐步GLM
考虑南
,''
(空字符向量),""
(空字符串),
,<定义>
价值观tbl
,X
,Y
丢失值。逐步GLM
不使用缺少匹配值的观测值。的观测信息
拟合模型的性质表明是否逐步GLM
把每个观察结果都用在合适的地方。
[1] Collett D。二进制数据建模。纽约:查普曼与霍尔出版社,2002年出版。
[2] 多布森,A.J。广义线性模型导论。纽约:查普曼与霍尔出版社,1990。
P. McCullagh和J. A. Nelder。广义线性模型。纽约:查普曼与霍尔出版社,1990。