通过添加或删除项来改进线性回归模型
逐步回归是一种系统方法,用于根据线性或广义线性模型中的术语在解释响应变量时的统计意义,添加和删除这些术语。该方法从使用指定的初始模型开始模型规格
,然后比较递增的较大模型和较小模型的解释力。
的一步
函数使用正向和向后逐步回归来确定最终模型。在每个步骤中,该函数搜索要添加到模型中的术语或要从模型中删除的术语“标准”
名称-值对的论点。
默认值“标准”
对于线性回归模型是上交所的
.在这种情况下,stepwiselm
和一步
属于linearmodel.
使用p价值的F-统计来测试模型在每个步骤中有或没有潜在的项。如果一项目前不在模型中,则零假设是,如果将该项添加到模型中,其系数将为零。如果有足够的证据拒绝零假设,该函数将该项添加到模型中。相反,如果一项目前在模型中,零假设是该项系数为零。如果没有足够的证据来拒绝原假设,该函数将从模型中删除该术语。
逐步回归在以下情况下采取这些步骤:“标准”
是上交所的
:
适合初始模型。
检查一组不在模型中的可用术语。如果有任何术语p-值小于入口公差(也就是说,如果将一项添加到模型中不太可能有零系数),则添加最小的一项p- value并重复这一步;否则,转到第3步。
如果模型中的任何可用术语都有p-大于退出公差的值(即,不能拒绝零系数的假设),删除具有最大值的项p- 留下并返回步骤2;否则,结束过程。
在任何阶段,如果模型不包括作为高阶项子集的所有低阶项,函数都不会添加高阶项。例如,函数不会尝试添加术语X1:X2^2
除非两X1
和x2 ^ 2
已经在模型中了。类似地,该函数不会删除模型中保留的高阶项子集的低阶项。例如,函数不会尝试删除X1
或x2 ^ 2
如果X1:X2^2
保持在模型中。
默认值“标准”
对于一个广义线性模型“越轨”
.逐步GLM
和一步
属于GeneralizedLinearModel
按照类似的程序添加或删除术语。
您可以使用“标准”
名称-值对的论点。例如,您可以指定Akaike信息标准、贝叶斯信息标准、r平方或调整的r平方的值的更改作为添加或删除项的标准。
根据初始模型中包含的术语以及函数添加和删除术语的顺序,该函数可以从同一组潜在术语构建不同的模型。当没有单个步骤改进模型时,该函数终止。然而,不同的初始模型或不同的步骤序列并不能保证更好的匹配。从这个意义上说,逐步模型是局部最优的,但可能不是全局最优的。
一步
将分类预测值处理如下:
一个有绝对预测器的模型l级别(类别)包括l- 1指标变量。模型使用第一个类别作为参考级别,因此不包括参考级别的指标变量。如果分类预测值的数据类型为分类
,然后您可以通过使用查看类别的顺序类别
并通过使用reordercats
自定义参考级别。创建指标变量的详细信息请参见虚拟变量的自动创建.
一步
对待一组l- 1指示器变量作为一个单独的变量。如果您想将指示器变量视为不同的预测变量,可以使用dummyvar
.然后使用指示器变量,除了适合模型时对应于分类变量的参考级别的字符。对于分类预测因子X
,如果指定的所有列dummyvar(X)
并以截距项作为预测因子,使设计矩阵秩亏缺。
连续预测器和分类预测器之间的交互项l层次由元素的乘积组成l- 1带有连续预测器的指标变量。
两个分类预测因子之间的相互作用项l和米级别包括(l- 1) * (米- 1)指标变量包括两个分类预测水平的所有可能组合。
不能为绝对预测器指定高阶项,因为指示器的平方等于它本身。
因此,如果一步
添加或删除一个分类预测器,该函数实际上在一个步骤中添加或删除一组指示器变量。类似地,如果一步
添加或删除带有分类预测器的交互项,该函数实际添加或删除包含分类预测器的交互项组。
使用stepwiselm
在初始模型中指定术语,并继续改进模型,直到没有任何添加或删除术语的步骤是有益的。