通过添加或移除术语来改进线性回归模型
逐步回归是基于解释响应变量的统计学意义,从线性或广义线性模型添加和移除术语的系统方法。该方法以初始模型开始,指定使用Modelspec.
,然后比较逐渐更大且较小模型的解释性。
的步
函数使用向前和向后逐步回归来确定最终模型。在每个步骤中,函数搜索术语以基于该值添加到模型或从模型中删除'标准'
名称-值对的论点。
默认值'标准'
对于线性回归模型是“上世纪”
.在这种情况下,步骤行程
和步
的linearmodel.
使用p价值的F-统计来测试模型在每个步骤中有或没有潜在的项。如果一项目前不在模型中,则零假设是,如果将该项添加到模型中,其系数将为零。如果有足够的证据拒绝零假设,该函数将该项添加到模型中。相反,如果一项目前在模型中,零假设是该项系数为零。如果没有足够的证据来拒绝原假设,该函数将从模型中删除该术语。
逐步回归何时采取这些步骤'标准'
是“上世纪”
:
适合初始模型。
检查模型中的一组可用术语。如果任何条款都有p-值小于入口公差(也就是说,如果将一项添加到模型中不太可能有零系数),则添加最小的一项p- value并重复这一步;否则,转到第3步。
如果模型中的任何可用术语都有p-Values大于退出公差(即,不能拒绝零系数的假设),删除最大的术语p- 留下并返回步骤2;否则,结束过程。
在任何阶段,如果模型不包括作为高阶项子集的所有低阶项,函数都不会添加高阶项。例如,函数不会尝试添加术语x1:x2 ^ 2
除非两者都是X1
和x2 ^ 2
已经在模型中。类似地,该功能不会删除是留在模型中的高阶项的子集的低阶项。例如,该函数不会尝试删除X1
要么x2 ^ 2
如果x1:x2 ^ 2
仍然在模型中。
默认值'标准'
对于一个广义线性模型'偏见'
.挺身油
和步
的GeneralizedLinearModel
遵循类似的过程来添加或删除术语。
您可以使用使用方法指定其他标准'标准'
名称-值对的论点。例如,您可以指定Akaike信息标准的值,贝叶斯信息标准,R线或调整的R线为标准作为添加或删除术语的标准。
根据初始模型中包含的条款,以及函数添加和删除术语的顺序,该函数可能会从同一组潜在术语构建不同的模型。当没有单步改善模型时,该函数终止。然而,不同的初始模型或不同的步骤序列不保证更合适。从这个意义上讲,逐步模型是局部最佳的,但可能不是全局最佳。
步
处理分类预测器,如下所示:
一个有绝对预测器的模型l级别(类别)包括l- 1指示器变量。该模型使用第一类作为参考级别,因此它不包括参考级别的指示灯。如果分类预测器的数据类型是分类
,然后您可以通过使用查看类别的顺序类别
并通过使用雷德斯
自定义参考级别。
步
对待一组l- 1指示器变量作为单个变量。如果要将指示器变量视为不同的预测器变量,请通过使用手动创建指示器变量dummyvar
.然后使用指示器变量,除了适合模型时对应于分类变量的参考级别的字符。对于分类预测因子X
,如果您指定所有列dummyvar(x)
并且作为预测器的截距术语,然后设计矩阵变为缺陷。
连续预测器和分类预测器之间的交互项l级别由元素 - 明智的产品组成l- 1具有连续预测器的指示器变量。
两个分类预测因子之间的交互条款l和米水平包括(l- 1) * (米- 1)指示器变量包括两个分类预测器级别的所有可能组合。
您无法为分类预测器指定高阶项,因为指示符的平方等于其自身。
因此,如果步
添加或删除一个分类预测器,该函数实际上在一个步骤中添加或删除一组指示器变量。类似地,如果步
通过分类预测器添加或删除交互项,该功能实际地添加或删除包括分类预测器的交互术语。
采用步骤行程
要在起始模型中指定术语并继续改进模型,直到没有单一的添加或删除术语是有益的。
采用addTerms
要么removeterms.
添加或删除特定术语。