通过添加或删除项来改进广义线性回归模型
逐步回归是一种系统的方法,在解释响应变量时,根据线性或广义线性模型的统计显著性添加和删除项。该方法从一个初始模型开始,使用指定的modelspec
,然后比较逐渐增大和减小的模型的解释能力。
的一步
函数使用正向和向后逐步回归来确定最终模型。在每个步骤中,该函数搜索要添加到模型中的术语或要从模型中删除的术语“标准”
名称-值对的论点。
默认值“标准”
对于线性回归模型是上交所的
.在这种情况下,步骤行程
和一步
的linearmodel.
使用p价值的F-统计来测试模型在每个步骤中有或没有潜在的项。如果一项目前不在模型中,则零假设是,如果将该项添加到模型中,其系数将为零。如果有足够的证据拒绝零假设,该函数将该项添加到模型中。相反,如果一项目前在模型中,零假设是该项系数为零。如果没有足够的证据来拒绝原假设,该函数将从模型中删除该术语。
逐步回归采用这些步骤时“标准”
是上交所的
:
适合初始模型。
检查一组不在模型中的可用术语。如果有任何条款p-值小于入口公差(也就是说,如果将一项添加到模型中不太可能有零系数),则添加最小的一项p- value并重复这一步;否则,转到第3步。
如果模型中的任何可用术语都有p-值大于退出公差(即不能拒绝系数为零的假设),删除最大的项p- 留下并返回步骤2;否则,结束过程。
在任何阶段,如果模型不包括作为高阶项子集的所有低阶项,函数都不会添加高阶项。例如,函数不会尝试添加术语X1, X2 ^ 2
除非两X1
和x2 ^ 2
已经在模型中了。类似地,该函数不会删除模型中保留的高阶项子集的低阶项。例如,函数不会尝试删除X1
或x2 ^ 2
如果X1, X2 ^ 2
保持在模型中。
默认值“标准”
对于一个广义线性模型“异常”
.stepwiseglm
和一步
的GeneralizedLinearModel
按照类似的程序添加或删除术语。
属性可以指定其他条件“标准”
名称-值对的论点。例如,您可以指定Akaike信息标准、贝叶斯信息标准、r平方或调整的r平方的值的更改作为添加或删除项的标准。
根据初始模型中包含的术语以及函数添加和删除术语的顺序,该函数可以从同一组潜在术语构建不同的模型。当没有单个步骤改进模型时,该函数终止。然而,不同的初始模型或不同的步骤序列并不能保证更好的匹配。从这个意义上说,逐步模型是局部最优的,但可能不是全局最优的。
一步
对分类预测器的处理如下:
一个有绝对预测器的模型l包括水平(类别)l- 1指标变量。模型使用第一个类别作为参考级别,因此不包含参考级别的指标变量。如果分类预测器的数据类型为分类
,然后您可以通过使用查看类别的顺序类别
并通过使用reordercats
自定义参考级别。
一步
对待一组l- 1指示器变量作为单个变量。如果要将指示器变量视为不同的预测器变量,请通过使用手动创建指示器变量dummyvar
.然后使用指示器变量,除了适合模型时对应于分类变量的参考级别的字符。对于分类预测因子X
,如果指定的所有列dummyvar (X)
并以截距项作为预测因子,使设计矩阵秩亏缺。
连续预测器和分类预测器之间的交互项l级别由元素 - 明智的产品组成l- 1具有连续预测器的指示器变量。
两个类别预测因子之间的交互项l和米水平包括(l- 1) * (米- 1)指标变量包括两个分类预测水平的所有可能组合。
不能为绝对预测器指定高阶项,因为指示器的平方等于它本身。
因此,如果一步
添加或删除一个分类预测器,该函数实际上在一个步骤中添加或删除一组指示器变量。类似地,如果一步
通过分类预测器添加或删除交互项,该功能实际地添加或删除包括分类预测器的交互术语。
一步
考虑南
,''
(空字符向量),""
(空字符串),<缺失>
,<定义>
值TBL.
,X
,Y
缺少值。一步
不使用符合缺失值的观察结果。的观察税收
拟合模型的属性表示是否一步
把每个观察结果都用在合适的地方。
使用stepwiseglm
在初始模型中指定术语,并继续改进模型,直到没有任何添加或删除术语的步骤是有益的。
使用addTerms
或removeTerms
添加或删除特定的术语。