执行逐步回归
你不能在逐步回归的同时使用稳健回归。在使用之前检查数据是否有异常值stepwiselm
.
对于其他方法,如方差分析
的属性LinearModel
对象,看到LinearModel
.
在训练一个模型之后,您可以生成预测新数据响应的C/ c++代码。生成C/ c++代码需要MATLAB编码器™.详情请参见代码生成简介.
逐步回归是一种系统的方法,根据在解释响应变量方面的统计显著性,从线性或广义线性模型中添加或删除项。该方法从一个指定为using的初始模型开始modelspec
,然后比较增量大模型和增量小模型的解释能力。
的stepwiselm
函数使用正向和向后逐步回归来确定最终模型。的值搜索要添加到模型或从模型中删除的术语“标准”
名称-值对参数。
的默认值。“标准”
对于线性回归模型是上交所的
.在这种情况下,stepwiselm
而且一步
的LinearModel
使用p的-值F-statistic在每个步骤中测试包含或不包含潜在项的模型。如果一个项目前不在模型中,零假设是,如果添加到模型中,该项的系数将为零。如果有足够的证据拒绝零假设,函数将该项添加到模型中。相反,如果一个项当前在模型中,零假设是该项的系数为零。如果没有足够的证据拒绝零假设,函数将从模型中删除该项。
逐步回归采取这些步骤时“标准”
是上交所的
:
拟合初始模型。
检查一组不在模型中的可用术语。如果任何条款有p-值小于入口公差(也就是说,如果添加到模型中的项的系数不可能为零),则添加最小的项p-value并重复此步骤;否则,请执行步骤3。
如果模型中任何可用的术语有p-大于出口公差的值(即不能拒绝系数为零的假设),去掉最大的项p-value返回步骤2;否则,请结束该进程。
在任何阶段,如果模型不包含作为高阶项子集的所有低阶项,则函数将不会添加高阶项。例如,函数不会尝试添加术语X1, X2 ^ 2
除非两X1
而且X2 ^ 2
已经在模型中了。同样,该函数也不会删除模型中保留的高阶项的子集中的低阶项。例如,函数将不会尝试删除X1
或X2 ^ 2
如果X1, X2 ^ 2
保留在模型中。
的默认值。“标准”
对于广义线性模型是“异常”
.stepwiseglm
而且一步
的GeneralizedLinearModel
在添加或删除术语时遵循类似的过程。
方法可以指定其他条件“标准”
名称-值对参数。例如,您可以指定Akaike信息准则、Bayesian信息准则、r -平方或调整后的r -平方的值的变化作为增加或删除项的准则。
根据初始模型中包含的术语,以及函数添加和删除术语的顺序,该函数可能从相同的潜在术语集构建不同的模型。当没有单一步骤改进模型时,函数终止。然而,不同的初始模型或不同的步骤顺序并不能保证更好的匹配。从这个意义上说,逐步模型是局部最优的,但可能不是全局最优的。
stepwiselm
将分类预测器处理如下:
一个有分类预测器的模型l级别(类别)包括l- 1指标变量。模型使用第一个类别作为参考级别,因此它不包括参考级别的指示器变量。如果分类预测器的数据类型为分类
,则可以使用类别
并通过使用对类别进行重新排序reordercats
自定义参考级别。有关创建指示符变量的详细信息,请参见虚拟变量的自动创建.
stepwiselm
对待一组l- 1指标变量作为单个变量。如果您想将指标变量视为不同的预测变量,请使用dummyvar
.然后,在拟合模型时,使用除对应于类别变量的参考级别的指示变量之外的指示变量。对于绝对预测器X
,如果指定的所有列dummyvar (X)
以截距项作为预测因子,则设计矩阵秩不足。
连续预测器和直言预测器之间的相互作用项l级别由元素的产品组成l- 1带有连续预测器的指标变量。
两个范畴预测器之间的相互作用项l而且米级别由(l- 1) * (米- 1)指标变量包括两个分类预测水平的所有可能组合。
不能为直言预测器指定高阶项,因为指标的平方等于它本身。
因此,如果stepwiselm
添加或删除一个分类预测器,该函数实际上是在一个步骤中添加或删除一组指标变量。类似地,如果stepwiselm
添加或删除带有类别预测器的交互项,该函数实际上添加或删除包含类别预测器的交互项组。
stepwiselm
认为南
,”
(空字符向量),""
(空字符串),< >失踪
,<定义>
值资源描述
,X
,Y
丢失的值stepwiselm
不使用在拟合中缺少值的观察值。的ObservationInfo
拟合模型的性质表明是否stepwiselm
在配合中使用每一个观察结果。
您可以使用fitlm
,然后手动调整模型使用一步
,addTerms
,或removeTerms
.