利用逐步回归拟合线性回归模型
逐步回归是一种根据响应变量的统计意义从线性或广义线性模型中添加或删除项的系统方法。该方法从一个初始模型开始,使用modelspec
,然后比较大小递增模型的解释能力。
的stepwiselm
函数使用前向和后向逐步回归来确定最终的模型。在每个步骤中,该函数根据的值搜索要添加到模型或从模型中删除的项“标准”
名称-值对的论点。
默认值“标准”
对于线性回归模型是“上证所”
。在这种情况下,stepwiselm
和一步
的线性模型
使用p- 值的F-统计测试模型的每一步是否有一个潜在的术语。如果某项当前不在模型中,则零假设是,如果将该项添加到模型中,则该项的系数为零。如果有足够的证据来拒绝原假设,则该函数将该项添加到模型中。相反,如果一个项当前在模型中,则零假设是该项的系数为零。如果没有足够的证据来拒绝原假设,该函数将从模型中删除该项。
逐步回归采取这些步骤时“标准”
是“上证所”
:
适合初始模型。
检查一组不在模型中的可用术语。如果有的话p-小于入口公差的值(也就是说,如果向模型中添加的项不太可能系数为零),则添加具有最小值的项p- 值并重复此步骤;否则,转到步骤3。
如果模型中的任何可用的条款有p-大于出口容限的值(即不能拒绝零系数的假设),删除最大的项p- 值和返回到步骤2;否则,结束处理。
在任何阶段,该功能不会增加高阶项,如果模型没有包括那些高阶项的子集所有低阶条款。例如,该功能不会尝试添加术语X1, X2 ^ 2
除非两X1
和X2 ^ 2
已经在模型中。同样,该功能不会删除是高阶项子集保留在模型低阶条款。例如,该功能不会尝试删除X1
要么X2 ^ 2
如果X1, X2 ^ 2
仍然在模型中。
默认值“标准”
对于广义线性模型是“越轨”
。stepwiseglm
和一步
的GeneralizedLinearModel
遵循用于添加或删除的术语类似的过程。
属性指定其他条件“标准”
名称-值对的论点。例如,您可以指定在赤池信息准则值的变化,贝叶斯信息准则,R平方,或经调整的R平方为准绳,以添加或删除条款。
根据包含在初始模型中的项,并在其中的作用增加的顺序及排除条款,该功能可能会从同一组潜在的术语建立不同的模型。当没有单个步骤提高了模型的功能终止。然而,不同的初始模型或步骤不同的顺序并不能保证更好的贴合。在这个意义上,逐步模型是局部最优的,但可能不是全局最优。
stepwiselm
对分类预测因子的处理如下:
与具有一个分类预测模型l包括水平(类别)l- 1指标变量。该模型使用第一个类别作为参考级别,因此它不包含参考级别的指标变量。如果分类预测器的数据类型为分类
,那么你可以通过检查类别的顺序类别
和重新排序的类别,通过使用reordercats
自定义参考电平。
stepwiselm
治疗组l- 1指示器变量作为单一变量。如果你想治疗的指标变量作为不同的预测变量,通过使用手动创建指标变量dummyvar
。然后使用指针变量,除了对应于所述分类变量的参考电平之一,当你适合的模型。对于分类预测X
如果您指定的所有列dummyvar (X)
而截距项作为预测项,则设计矩阵存在秩亏。
连续预测项和分类预测项之间的交互项l级别由元素-明智的乘积组成l- 1指标变量与连续预测。
有两个分类预测变量之间的相互作用方面l和米水平由的(l- 1)*(米- 1)指标变量,包括两个分类预测级别的所有可能的组合。
你不能为分类预测指定高阶项,因为指标的平方等于本身。
因此,如果stepwiselm
添加或删除一个分类预测器,该函数实际上在一步中添加或删除一组指标变量。类似地,如果stepwiselm
添加或删除与范畴预测器的交互项,该函数实际上添加或删除包括范畴预测器在内的一组交互项。
stepwiselm
认为南
,“”
(空字符向量),“”
(空字符串),<失踪>
和<定义>
值资源描述
,X
和Y
是缺失值。stepwiselm
不与配合缺失值使用的意见。的ObservationInfo
一个拟合模型的属性指示是否stepwiselm
使用每个观察在适合。
您可以通过构建一个模型fitlm
,然后手动调整模型使用一步
,addTerms
,或removeTerms
。