stepwiselm

进行逐步回归

折叠所有页面

语法

mdl = stepwiselm(台)

mdl = stepwiselm (X, y)

mdl = stepwiselm (＿＿＿modelspec)

mdl = stepwiselm (＿＿＿、名称、值)

描述

例子

mdl= stepwiselm (资源描述）为表或数据集数组中的变量创建一个线性模型资源描述使用逐步回归来添加或删除预测，从一个常数模型开始。stepwiselm使用的最后一个变量资源描述作为响应变量。stepwiselm使用正向和向后逐步回归来确定最终模型。在每一步中，该函数都根据属性的值搜索术语，以便向模型中添加或从模型中删除“标准”论点。

例子

mdl= stepwiselm (X，y）创建响应的线性模型y到数据矩阵中的预测变量X．

例子

mdl= stepwiselm (＿＿＿，modelspec）指定起始模型modelspec使用前面语法中的任何输入参数组合。

例子

mdl= stepwiselm (＿＿＿，名称,值）使用一个或多个名称-值对参数指定其他选项。例如，您可以指定分类变量，在模型中使用的最小或最大的术语集，采取的最大步骤数，或标准stepwiselm用于添加或删除术语。

例子

全部折叠

用逐步回归拟合线性模型

打开生活的脚本

加载哈尔德数据集，测量水泥成分对其硬化热的影响。

负载哈尔德

这个数据集包括变量成分和热．矩阵成分含有水泥中四种化学物质的百分比。向量热包含每个水泥样品在180天后的热硬化值。

对数据拟合一个逐步线性回归模型。指定0.06作为向模型添加术语的条件的阈值。

mdl = stepwiselm(成分、热、“囚禁”, 0.06)

1.添加x4, FStat = 22.7985, pValue = 0.000576232添加x1, FStat = 108.2239, pValue = 1.105281e-063 .添加x2, FStat = 5.0259, pValue = 0.051687移除x4, FStat = 1.8633, pValue = 0.2054

mdl =线性回归模型:y ~ 1 + x1 + x2估计系数:估计SE tStat pValue  ________ ________ ______ __________ ( 拦截)52.577 2.2862 22.998 5.4566平台以及x1 e-07 x2 0.66225 0.045855 14.442 2.6922 1.4683 0.1213 12.105 5.029 e-08数量的观察:13日误差自由度:10根均方误差:2.41平方:0.979，调整后的R-Squared: 0.974 F-statistic vs. constant model: 230, p-value = 4.41e-09

默认情况下，启动模型是一个常量模型。stepwiselm执行前向选择并添加x4，x1,x2项(按那个顺序)，因为相应的p-值小于被关闭的值为0.06。stepwiselm然后使用反向消除和删除x4因为，曾经x2是在模型中p价值的x4大于默认值PRemove0.1点。

使用指定的模型公式和变量的逐步回归

打开生活的脚本

使用存储在数据集数组中的变量执行逐步回归。使用威尔金森符号指定开始模型，并使用可选参数标识响应和预测器变量。

加载示例数据。

负载医院

医院数据集数组包括患者的性别、年龄、体重和吸烟状况。

拟合一个以常数项和为起始模型的线性模型吸烟者作为预测变量。指定响应变量，重量，和分类预测变量，性，年龄,吸烟者．

mdl = stepwiselm(医院,的体重~ 1 +抽烟'，…“ResponseVar”，“重量”，“PredictorVars”, {“性”，“年龄”，“抽烟”}，…“CategoricalVar”, {“性”，“抽烟”}）

1.添加性别，FStat = 770.0158, pValue = 6.262758e-48移除吸烟者，FStat = 0.21224, pValue = 0.64605

mdl = Linear regression model: Weight ~ 1 + Sex Estimated Coefficients: Estimate SE tStat pValue ________ ______ ______ ___________ (Intercept) 130.47 1.1995 108.77 5.2762e-104 Sex_Male 50.06 1.7496 28.612 2.2464e-49观测数:100，误差自由度:98均方根误差:8.73 r²:0.893，校正r²:0.892 F-statistic vs. constant model: 819, p-value = 2.25e-49

在每个步骤中,stepwiselm搜索要添加和删除的词汇。第一步，逐步算法添加性到模型的a $p$ 6.26 e-48的价值。然后，从模型中删除吸烟者，因为给定性在模型中，变量吸烟者成为多余的。stepwiselm只包括性在最后的线性模型中。患者的体重似乎并不因年龄或吸烟状况而有显著差异。

使用术语矩阵的逐步回归

打开生活的脚本

加载一个样本数据集并定义预测器矩阵。

负载carsmallX =(加速度、重量);

使用术语矩阵定义起始模型和上部模型。

t_start = [0 0 0]常数模型

T_starting =1×30 0 0

T_upper = [0 0 0;1 0 0;1 1 0]%具有相互作用的线性模型

T_upper =4×30 0 0 1 0 0 1 0 0 1 1 0 1 1 1 0

使用逐步回归创建线性回归模型。使用术语矩阵指定起始模型和模型的上界，并指定“详细”如2，显示评估过程和每一步所做的决定。

T_starting mdl = stepwiselm (X,英里/加仑,“上”T_upper,“详细”，2)

添加x1的pValue为4.0973e-06添加x2的pValue为1.6434e-28 1。添加x1的pValue是0.18493没有候选项要删除

mdl = Linear regression model: y ~ 1 + x2 Estimated Coefficients: Estimate SE tStat pValue __________ _________ _______ __________ (Intercept) 49.238 1.6411 30.002 2.7015e-49 x2 -0.0086119 0.0005348 -16.103 1.6434e-28观测数:94，误差自由度:92均方根误差:4.13 r平方:0.738，校正r平方:0.735 F-statistic vs. constant model: 259, p-value = 1.64e-28

分类预测器的逐步回归

打开生活的脚本

拟合线性回归模型与分类预测器使用逐步回归。stepwiselm在一个步骤中添加或删除一组指示器变量，以添加或删除分类预测器。这个示例还展示了如何手动创建指示器变量并将它们传递给stepwiselm这stepwiselm将每个指标变量视为独立的预测因子。

加载carsmall属性创建表，并使用重量，Model_Year,英里/加仑变量。

负载carsmall年=分类(Model_Year);tbl1 =表(MPG、重量、年);

拟合的线性回归模型英里/加仑利用逐步回归。指定起始模型为的函数重量．将模型的上限设置为“poly21”，这意味着模型可以(最多)包含一个常数和术语重量，体重^ 2，一年,重量*年．指定“详细”如2，显示评估过程和每一步所做的决定。

mdl1 = stepwiselm (tbl1,英里/加仑~体重的，“上”，“poly21”，“详细”，2)

添加Year的pValue为8.2284e-15。添加Weight^2的pValue为0.15454 1。添加年份，FStat = 47.5136, pValue = 8.22836e-15添加重量^2的pValue为0.0022303 pValue为添加重量:年份为0.0071637 2。添加Weight^2, FStat = 9.9164, pValue = 0.0022303添加Weight的pValue:Year为0.19519 pValue删除Year为2.9042e-16

mdl1 =线性回归模型:MPG ~ 1 +权重+年+权重^2Estimate SE tStat pValue __________ __________ _______ __________ (Intercept) 54.206 4.7117 11.505 2.6648e-19 Weight -0.016404 0.0031249 -5.2493 1.0283e-06 Year_76 2.0887 0.71491 2.9215 0.0044137 Year_82 8.1864 0.81531 10.041 2.6364e-16 Weight^2 1.5573 -06 4.9454e-07 3.149 0.0022303观测数:94、误差自由度:89均方根误差:2.78 r平方:0.885，校正r平方:0.88 f统计量与常数模型:172,p-value = 5.52 -41

stepwiselm创建两个指示器变量，Year_76和Year_82,因为一年包括三个不同的值。

因为“详细”是2,stepwiselm显示评估过程:

stepwiselm的函数创建一个模型重量．
stepwiselm计算p值添加一年或体重^ 2．的p值为一年是小于两者的p值为体重^ 2且默认阈值为0.05;因此,stepwiselm增加了一年到模型中。
stepwiselm计算p值添加重量:一年或体重^ 2．因为p值为体重^ 2小于p值为重量:一年,stepwiselm功能补充道体重^ 2到模型中。
加上二次项之后，stepwiselm计算p价值增加重量:一年再次,但p-value大于阈值。因此,stepwiselm不向模型中添加术语。stepwiselm不检查添加体重^ 3因为“上”名称-值对的论点。
stepwiselm寻找要删除的条款。stepwiselm已经检查了体重^ 2，所以它只计算p值为删除一年．因为p-value小于默认阈值0.10，stepwiselm并没有去掉这个词。
虽然允许的最大步数是5步，stepwiselm在两个步骤之后终止流程，因为模型没有通过添加或删除一个术语来改进。

stepwiselm将两个指标变量视为一个预测变量，并相加一年在一个步骤。将两个指标变量视为两个不同的预测变量，使用dummyvar创建单独的分类变量。

temp_Year = dummyvar(年);Year_76 =逻辑(temp_Year (:, 2));Year_82 =逻辑(temp_Year (:, 3));

创建一个包含英里/加仑，重量，Year_76,Year_82．

tbl2 =表(MPG、重量、Year_76 Year_82);

从相同的开始模型创建一个逐步线性回归模型mdl1．

mdl2 = stepwiselm (tbl2,英里/加仑~体重的，“上”，“poly211”）

1.添加Year_82, FStat = 83.1956, pValue = 1.76163e-14添加重量:Year_82, FStat = 8.0641, pValue = 0.0055818添加Year_76, FStat = 8.1284, pValue = 0.0054157

mdl2 =线性回归模型:MPG ~ 1 + Year_76 + Weight*Year_82Estimate SE tStat pValue __________ __________ _______ __________ (Intercept) 38.844 1.5294 25.397 1.503e-42 Weight -0.006272 0.00042673 -14.698 1.5622e-25 Year_76_1 2.0395 0.71537 2.851 0.0054157 Year_82_1 19.607 3.8731 5.0623 2.2163e-06 Weight:Year_82_1 -0.0046268 0.0014979 -3.0888 0.0026806观测数:94、误差自由度:89均方根误差:2.79 R-squared: 0.885，调整R-squared: 0.88 F-statistic vs. constant model: 171, p-value = 6.54e-41

该模型mdl2包括相互作用项重量:Year_82_1而不是体重^ 2，包括在其中的术语mdl1．

输入参数

全部折叠

`资源描述`- - - - - -输入数据
表格|数据集的数组

输入数据，包括预测器和响应变量，指定为表或数据集数组。预测变量可以是数字、逻辑、类别、字符或字符串。响应变量必须是数字或逻辑的。

默认情况下,stepwiselm将最后一个变量作为响应变量，其余变量作为预测变量。
要将不同的列设置为响应变量，请使用ResponseVar名称-值对的论点。
要使用列的子集作为预测器，请使用PredictorVars名称-值对的论点。
要定义模型规范，请设置modelspec使用公式或术语矩阵的参数。公式或术语矩阵指定使用哪些列作为预测器或响应变量。

表中的变量名不一定是有效的MATLAB^®标识符。但是，如果名称无效，则在适合或调整模型时不能使用公式;例如:

你不能指定modelspec使用一个公式。
属性时，不能使用公式指定要添加或删除的术语addTerms函数或removeTerms函数,分别。
属性时，不能使用公式来指定模型的上下限一步或stepwiselm函数的名称-值对参数“低”和“上”,分别。

您可以验证变量名资源描述通过使用isvarname函数。如果变量名无效，则可以使用matlab.lang.makeValidName函数。

`X`- - - - - -预测变量
矩阵

预测变量，指定为n——- - - - - -p矩阵,n观察的次数是多少p为预测变量的数量。每一列的X表示一个变量，每一行表示一个观察。

默认情况下，模型中有一个常数项，除非你明确地删除它，所以不要在其中包含一列1X．

数据类型:单|双

`y`- - - - - -反应变量
向量

响应变量，指定为n1的向量,n为观察次数。中的每个条目y对应一行的响应是X．

数据类型:单|双|逻辑

`modelspec`- - - - - -从模型
`“不变”`(默认)|命名模型的字符向量或字符串标量|t————(p+ 1)项矩阵|字符向量或字符串标量公式的形式`“y ~条款”`

开始逐步回归模型，具体如下:

命名模型的字符向量或字符串标量。

价值	模型类型
`“不变”`	模型只包含一个常数(截距)项。
`“线性”`	模型包含每个预测器的截距和线性项。
`“互动”`	模型包含每个预测器的截距，线性项，以及对不同预测器的所有乘积(没有平方项)。下载188bet金宝搏
`“purequadratic”`	模型包含截距项、线性项和平方项。
`“二次”`	模型包含每个预测器的截距项、线性项和平方项，以及对不同预测器的所有乘积。下载188bet金宝搏
`“聚ijk＇`	模型是一个多项式，所有项都达到次`我`第一个预测因子是程度`j`在第二个预测中，等等。通过使用数字0到9指定每个预测器的最大程度。模型中包含交互项，但每个交互项的程度不超过指定程度的最大值。例如,`“poly13”`有一个截距x₁，x₂，x₂²，x₂^3.，x₁＊x₂,x₁＊x₂²条款,x₁和x₂分别是第一和第二预测因素。

一个t————(p+ 1)矩阵，或者a计算矩阵，在模型中指定项，其中t是多少项和p为预测变量的个数，+1表示响应变量。当预测器的数量很大且您希望以编程方式生成术语时，术语矩阵是很方便的。
字符向量或字符串标量公式在表单中

“y ~条款”，

在哪里条款在威尔金森符号．公式中的变量名必须是资源描述或指定的变量名Varnames．此外，变量名必须是有效的MATLAB标识符。
该软件通过使用中术语的顺序来确定拟合模型中术语的顺序资源描述或X．因此，模型中项的顺序可能与指定公式中项的顺序不同。

如果您想指定模型中最小或最大的项集stepwiselm适合,使用较低的和上名称-值对参数。

数据类型:字符|字符串|单|双

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家．

例子:另类投资会议”、“标准”、“‘上’,‘互动’,‘详细’,1指示stepwiselm来使用Akaike信息标准，显示它在每个步骤中所采取的操作，并在模型中最多包含交互项。

`CategoricalVars`- - - - - -分类变量列表
字符串数组|字符向量的单元格数组|逻辑或数字索引向量

分类变量列表，指定为逗号分隔对，由“CategoricalVars”以及在表或数据集数组中包含分类变量名的字符向量的字符串数组或单元格数组资源描述，或指示哪些列是分类列的逻辑或数字索引向量。

如果数据在表或数据集数组中资源描述，那么默认情况下，stepwiselm将所有分类值、逻辑值、字符数组、字符串数组和字符向量的单元格数组视为分类变量。
如果数据在矩阵中X，则为的默认值“CategoricalVars”是一个空矩阵[]．也就是说，没有一个变量是绝对的，除非你指定它为绝对的。

例如，您可以使用以下任意一种方法指定六个变量中的第二个和第三个变量为分类变量:

例子:“CategoricalVars”,[2,3]

例子:'CategoricalVars'，逻辑([0 1 1 0 0])

数据类型:单|双|逻辑|字符串|细胞

`标准`- - - - - -标准来添加或删除条款
`上交所的`(默认)|`“另类投资会议”`|`“bic”`|`“rsquared”`|`“adjrsquared”`

条件来添加或删除指定为逗号分隔对的项，由“标准”其中一个价值观是:

上交所的- - - - - -p价值的F-增加或删除项的平方和误差变化的检验
“另类投资会议”-赤池信息准则(AIC)值的变化
“bic”-贝叶斯信息准则(BIC)值的变化
“rsquared”-增加价值R²
“adjrsquared”-调整值增加R²

例子:“标准”、“bic”

`排除`- - - - - -观察排除
逻辑或数字索引向量

要从匹配中排除的观察值，指定为由逗号分隔的对组成“排除”以及逻辑或数字索引向量，指示要从拟合中排除哪些观测值。

例如，您可以使用下面的任何一个示例排除6个观察值中的2个和3个。

例子:“排除”,[2,3]

例子:'排除'，逻辑([0 1 1 0 0])

数据类型:单|双|逻辑

`拦截`- - - - - -常数项指示器
`真正的`(默认)|`假`

适应度中的常数项(截距)指示符，指定为逗号分隔的对组成“拦截”,要么真正的包括或假从模型中移除常数项。

使用“拦截”仅当使用字符向量或字符串标量指定模型时，而不是使用公式或矩阵。

例子:“拦截”,假的

`较低的`- - - - - -描述不能从模型中删除的术语的模型规范
`“不变”`(默认)|特征向量|字符串标量|计算矩阵

描述不能从模型中删除的术语的模型规范，由逗号分隔的对组成“低”其中一个选择是modelspec命名模型。

例子:“低”,“线性”

`NSteps`- - - - - -要采取的最大步骤数
没有限制(默认)|正整数

要采取的最大步骤数，指定为逗号分隔的对，包括“NSteps”一个正整数。

例子:“NSteps”,5

数据类型:单|双

`被关闭的`- - - - - -阈值为标准添加项
标量值

用于添加术语的条件的阈值，指定为逗号分隔对，由“囚禁”和标量值，如表所示。

标准	默认值	决定
`上交所的`	0．05	如果p价值的F-统计数字小于`被关闭的`（p-value to enter)，将术语添加到模型中。
`“另类投资会议”`	0	如果模型AIC的变化小于`被关闭的`，将术语添加到模型中。
`“BIC”`	0	如果模型中BIC的变化小于`被关闭的`，将术语添加到模型中。
`“Rsquared”`	０.１	如果模型的r平方值增加大于`被关闭的`，将术语添加到模型中。
`“AdjRsquared”`	0	如果模型调整后的r平方值增加大于`被关闭的`，将术语添加到模型中。

有关更多信息，请参见标准名称-值对的论点。

例子:“囚禁”,0.075

`PredictorVars`- - - - - -预测变量
字符串数组|字符向量的单元格数组|逻辑或数字索引向量

要在适合的情况下使用的预测变量，指定为逗号分隔对组成“PredictorVars”以及表或数据集数组中变量名的字符向量的字符串数组或单元格数组资源描述，或逻辑或数字索引向量，指示哪些列是预测变量。

中的名称应包含字符串值或字符向量资源描述，或使用“VarNames”名称-值对的论点。

默认是所有的变量X，或所有变量资源描述除了ResponseVar．

例如，您可以使用以下任意一个示例指定第二个和第三个变量作为预测变量。

例子:“PredictorVars”,[2,3]

例子:'PredictorVars'，逻辑([0 1 1 0 0])

数据类型:单|双|逻辑|字符串|细胞

`PRemove`- - - - - -去除条件的阈值
标量值

用于删除术语的条件的阈值，指定为逗号分隔对，由“PRemove”和标量值，如表所示。

标准	默认值	决定
`上交所的`	0．10	如果p价值的F-统计量大于`PRemove`（p-value to remove)，从模型中移除术语。
`“另类投资会议”`	０．０１	如果模型AIC的变化大于`PRemove`，将该术语从模型中删除。
`“BIC”`	０．０１	如果模型中BIC的变化大于`PRemove`，将该术语从模型中删除。
`“Rsquared”`	0．05	如果模型r平方值的增加小于`PRemove`，将该术语从模型中删除。
`“AdjRsquared”`	-0.05	若模型调整后的r平方值增加小于`PRemove`，将该术语从模型中删除。

在每一步，stepwiselm函数还检查当前模型中某个项与其他项是否冗余(线性相关)。当任意项与当前模型中的其他项线性相关时，则stepwiselm函数删除冗余项，而不考虑标准值。

有关更多信息，请参见标准名称-值对的论点。

例子:“PRemove”,0.05

`ResponseVar`- - - - - -反应变量
最后一列`资源描述`(默认)|包含变量名的字符向量或字符串标量|逻辑或数字索引向量

响应变量要在适合中使用，指定为逗号分隔对组成“ResponseVar”以及在表或数据集数组中包含变量名的字符向量或字符串标量资源描述，或逻辑或数字索引向量，指示哪一列是响应变量。你通常需要使用“ResponseVar”当拟合表或数据集数组时资源描述．

例如，您可以指定第四个变量收益率，作为对六个变量的响应，以下列方式之一。

例子:“ResponseVar”、“收益”

例子:“ResponseVar”,[4]

例子:'ResponseVar'，逻辑([0 0 0 1 0 0])

数据类型:单|双|逻辑|字符|字符串

`上`- - - - - -描述适合的最大术语集的模型规范
`“互动”`(默认)|特征向量|字符串标量|计算矩阵

模型规范描述了最大的适合的术语集，指定为逗号分隔对组成“上”其中一个选择是modelspec命名模型。

例子:“上”、“二次”

`VarNames`- - - - - -变量的名字
`{x1, x2,…,‘xn’,‘y’}`(默认)|字符串数组|字符向量的单元格数组

用逗号分隔的变量对指定的变量名，由“VarNames”以及字符向量的字符串数组或单元格数组，其中包括的列的名称X首先是响应变量的名称y最后一次。

“VarNames”不适用于表或数据集数组中的变量，因为这些变量已经有了名称。

变量名不必是有效的MATLAB标识符。但是，如果名称无效，则在适合或调整模型时不能使用公式;例如:

属性时，不能使用公式指定要添加或删除的术语addTerms函数或removeTerms函数,分别。
属性时，不能使用公式来指定模型的上下限一步或stepwiselm函数的名称-值对参数“低”和“上”,分别。

在指定VarNames, VarNames，可以验证变量名varNames通过使用isvarname函数。如果变量名无效，则可以使用matlab.lang.makeValidName函数。

例子:VarNames,{“马力”,“加速”,“Model_Year”,“英里”}

数据类型:字符串|细胞

`详细的`- - - - - -控件，用于显示信息
`1`(默认)|`0`|`2`

控件，指定为逗号分隔的对，由“详细”其中一个价值观是:

0—禁止所有显示。
1-显示在每一步采取的行动。
2-展示评估过程和每一步采取的行动。

例子:“详细”,2

`权重`- - - - - -观察权重
`的(n, 1)`(默认)|n非负标量值的-乘1向量

观察权值，指定为逗号分隔的对，由“重量”和一个n非负标量值的-by-1向量，其中n为观察次数。

数据类型:单|双

输出参数

全部折叠

`mdl`——线性模型
`LinearModel`对象

表示对数据响应的最小二乘拟合的线性模型，返回为LinearModel对象。

对于线性模型对象的属性和方法，mdl,请参阅LinearModel类页面。

威尔金森符号	标准符号术语
`1`	常数(拦截)
`x1 ^ k`,在那里`k`为正整数	`x1`，`x1²`、……`x1^k`
`x1 + x2`	`x1`，`x2`
`x1 * x2`	`x1`，`x2`，`x1 * x2`
`x1, x2`	`x1 * x2`只有
`x2`	不包括`x2`
`x1 * x2 + x3`	`x1`，`x2`，`x3`，`x1 * x2`
`X1 + x2 + x3 + X1:x2`	`x1`，`x2`，`x3`，`x1 * x2`
`x1 * x2 * x3 - x1, x2, x3`	`x1`，`x2`，`x3`，`x1 * x2`，`x1 * x3`，`x2 * x3`
`x1 * (x2 + x3)`	`x1`，`x2`，`x3`，`x1 * x2`，`x1 * x3`

提示

你不能在逐步回归中使用稳健回归。在使用之前检查数据中的异常值stepwiselm．
对于其他方法，例如方差分析的属性LinearModel对象,看到LinearModel．
在训练模型之后，您可以生成C/ c++代码来预测对新数据的响应。生成C/ c++代码需要MATLAB编码器™．有关详细信息,请参见代码生成简介．

算法

逐步回归是一种系统的方法，在解释响应变量时，根据线性或广义线性模型的统计显著性添加和删除项。该方法从一个初始模型开始，使用指定的modelspec，然后比较逐渐增大和减小的模型的解释能力。
的stepwiselm函数使用正向和向后逐步回归来确定最终模型。在每个步骤中，该函数搜索要添加到模型中的术语或要从模型中删除的术语“标准”名称-值对的论点。
的默认值“标准”对于线性回归模型是上交所的．在这种情况下,stepwiselm和一步的LinearModel使用p价值的F-统计来测试模型在每个步骤中有或没有潜在的项。如果一项目前不在模型中，则零假设是，如果将该项添加到模型中，其系数将为零。如果有足够的证据拒绝零假设，该函数将该项添加到模型中。相反，如果一项目前在模型中，零假设是该项系数为零。如果没有足够的证据来拒绝原假设，该函数将从模型中删除该术语。
逐步回归采用这些步骤时“标准”是上交所的：
1. 适合初始模型。
2. 检查一组不在模型中的可用术语。如果有任何条款p-值小于入口公差(也就是说，如果将一项添加到模型中不太可能有零系数)，则添加最小的一项p-value并重复此步骤;否则，请转步骤3。
3. 如果模型中有任何可用的条款p-值大于退出公差(即不能拒绝系数为零的假设)，删除最大的项p-value和返回步骤2;否则，结束该进程。
在任何阶段，如果模型不包括作为高阶项子集的所有低阶项，函数都不会添加高阶项。例如，函数不会尝试添加术语X1, X2 ^ 2除非两X1和X2 ^ 2已经在模型中了。类似地，该函数不会删除模型中保留的高阶项子集的低阶项。例如，函数不会尝试删除X1或X2 ^ 2如果X1, X2 ^ 2保持在模型中。
的默认值“标准”对于一个广义线性模型“异常”．stepwiseglm和一步的GeneralizedLinearModel按照类似的程序添加或删除术语。
属性可以指定其他条件“标准”名称-值对的论点。例如，您可以指定Akaike信息标准、贝叶斯信息标准、r平方或调整的r平方的值的更改作为添加或删除项的标准。
根据初始模型中包含的术语以及函数添加和删除术语的顺序，该函数可以从同一组潜在术语构建不同的模型。当没有单个步骤改进模型时，该函数终止。然而，不同的初始模型或不同的步骤序列并不能保证更好的匹配。从这个意义上说，逐步模型是局部最优的，但可能不是全局最优的。
stepwiselm对分类预测器的处理如下:
- 一个有绝对预测器的模型l包括水平(类别)l- 1指标变量。模型使用第一个类别作为参考级别，因此不包含参考级别的指标变量。如果分类预测器的数据类型为分类，则可以使用类别并通过使用reordercats自定义参考级别。创建指标变量的详细信息请参见虚拟变量的自动创建．
- stepwiselm对待一组l- 1指示器变量作为一个单独的变量。如果您想将指示器变量视为不同的预测变量，可以使用dummyvar．然后在拟合模型时，使用除分类变量参考水平对应的指标变量外的其他指标变量。对于绝对预测器X，如果指定的所有列dummyvar (X)并以截距项作为预测因子，使设计矩阵秩亏缺。
- 连续预测器和分类预测器之间的交互项l层次由元素的乘积组成l- 1带有连续预测器的指标变量。
- 两个类别预测因子之间的交互项l和米级别包括（l- 1) * (米- 1)指标变量包括两个分类预测水平的所有可能组合。
- 不能为绝对预测器指定高阶项，因为指示器的平方等于它本身。
因此,如果stepwiselm添加或删除一个分类预测器，该函数实际上在一个步骤中添加或删除一组指示器变量。类似地,如果stepwiselm添加或删除带有分类预测器的交互项，该函数实际添加或删除包含分类预测器的交互项组。
stepwiselm认为南，＇＇(空字符向量),＂＂(空字符串),< >失踪,<定义>值资源描述，X,Y丢失值。stepwiselm不使用缺少匹配值的观测值。的ObservationInfo拟合模型的性质表明是否stepwiselm把每个观察结果都用在合适的地方。

选择功能

您可以使用fitlm，然后手动调整模型使用一步，addTerms,或removeTerms．

另请参阅

LinearModel|一步|fitlm

主题

介绍了R2013b

stepwiselm

语法

描述

例子

用逐步回归拟合线性模型

使用指定的模型公式和变量的逐步回归

使用术语矩阵的逐步回归

分类预测器的逐步回归

输入参数

资源描述- - - - - -输入数据表格|数据集的数组

X- - - - - -预测变量矩阵

y- - - - - -反应变量向量

modelspec- - - - - -从模型“不变”(默认)|命名模型的字符向量或字符串标量|t————(p+ 1)项矩阵|字符向量或字符串标量公式的形式“y ~条款”

名称-值参数

CategoricalVars- - - - - -分类变量列表字符串数组|字符向量的单元格数组|逻辑或数字索引向量

标准- - - - - -标准来添加或删除条款上交所的(默认)|“另类投资会议”|“bic”|“rsquared”|“adjrsquared”

排除- - - - - -观察排除逻辑或数字索引向量

拦截- - - - - -常数项指示器真正的(默认)|假

较低的- - - - - -描述不能从模型中删除的术语的模型规范“不变”(默认)|特征向量|字符串标量|计算矩阵

NSteps- - - - - -要采取的最大步骤数没有限制(默认)|正整数

被关闭的- - - - - -阈值为标准添加项标量值

PredictorVars- - - - - -预测变量字符串数组|字符向量的单元格数组|逻辑或数字索引向量

PRemove- - - - - -去除条件的阈值标量值

ResponseVar- - - - - -反应变量最后一列资源描述(默认)|包含变量名的字符向量或字符串标量|逻辑或数字索引向量

上- - - - - -描述适合的最大术语集的模型规范“互动”(默认)|特征向量|字符串标量|计算矩阵

VarNames- - - - - -变量的名字{x1, x2,…,‘xn’,‘y’}(默认)|字符串数组|字符向量的单元格数组

详细的- - - - - -控件，用于显示信息1(默认)|0|2

权重- - - - - -观察权重的(n, 1)(默认)|n非负标量值的-乘1向量

输出参数

mdl——线性模型LinearModel对象

更多关于

计算矩阵

公式

威尔金森符号

提示

算法

选择功能

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一步一步的指导与MATLAB

`资源描述`- - - - - -输入数据
表格|数据集的数组

`X`- - - - - -预测变量
矩阵

`y`- - - - - -反应变量
向量

`modelspec`- - - - - -从模型
`“不变”`(默认)|命名模型的字符向量或字符串标量|t————(p+ 1)项矩阵|字符向量或字符串标量公式的形式`“y ~条款”`

`CategoricalVars`- - - - - -分类变量列表
字符串数组|字符向量的单元格数组|逻辑或数字索引向量

`标准`- - - - - -标准来添加或删除条款
`上交所的`(默认)|`“另类投资会议”`|`“bic”`|`“rsquared”`|`“adjrsquared”`

`排除`- - - - - -观察排除
逻辑或数字索引向量

`拦截`- - - - - -常数项指示器
`真正的`(默认)|`假`

`较低的`- - - - - -描述不能从模型中删除的术语的模型规范
`“不变”`(默认)|特征向量|字符串标量|计算矩阵

`NSteps`- - - - - -要采取的最大步骤数
没有限制(默认)|正整数

`被关闭的`- - - - - -阈值为标准添加项
标量值

`PredictorVars`- - - - - -预测变量
字符串数组|字符向量的单元格数组|逻辑或数字索引向量

`PRemove`- - - - - -去除条件的阈值
标量值

`ResponseVar`- - - - - -反应变量
最后一列`资源描述`(默认)|包含变量名的字符向量或字符串标量|逻辑或数字索引向量

`上`- - - - - -描述适合的最大术语集的模型规范
`“互动”`(默认)|特征向量|字符串标量|计算矩阵

`VarNames`- - - - - -变量的名字
`{x1, x2,…,‘xn’,‘y’}`(默认)|字符串数组|字符向量的单元格数组

`详细的`- - - - - -控件，用于显示信息
`1`(默认)|`0`|`2`

`权重`- - - - - -观察权重
`的(n, 1)`(默认)|n非负标量值的-乘1向量

`mdl`——线性模型
`LinearModel`对象