removeterms.

从线性回归模型中删除术语

描述

例子

newmdl.= removeterms(mdl术语返回使用输入数据和设置拟合的线性回归模型mdl凭借这些条款术语删除了。

例子

全部收缩

创建一个线性回归模型使用hal数据集。删除有高的项P.- 值。

加载数据集。

加载halx =成分;%预测因子变量y =热量;%响应变量

适合数据的线性回归模型。

mdl = fitlm(x,y)
mdl =线性回归模型:y ~ 1 + x1 + x2 + x3 + x4估计系数:估计SE tStat pValue  ________ _______ ________ ________ ( 拦截x1) 62.405 70.071 0.8906 0.39913 1.5511 0.74477 2.0827 0.070822 x2 0.51017 0.10191 0.75471 0.13503 0.89592 0.72379 0.70486 0.5009 x3 x4 -0.14406 0.70905 -0.20317 0.84407数量的观察:13、误差自由度:8均方根误差:2.45 r平方:0.982,校正r平方:0.974 F-statistic vs. constant model: 111, p-value = 4.76e-07

去除那个X3X4术语因为他们P.值很高。

条款='x3 + x4';删除%条款newmdl = removeterms(mdl,术语)
NewMdl =线性回归模型:y ~ 1 + x1 + x2估计系数:估计SE tStat pValue  ________ ________ ______ __________ ( 拦截)52.577 2.2862 22.998 5.4566平台以及x1 e-07 x2 0.66225 0.045855 14.442 2.6922 1.4683 0.1213 12.105 5.029 e-08数量的观察:13日误差自由度:10根均方误差:2.41平方:0.979,调整后的R-Squared: 0.974 F-statistic vs. constant model: 230, p-value = 4.41e-09

newmdl.具有相同的调整后的R线值(0.974)作为以前的模型,这意味着FIT在新模型中具有好处。新模型中的所有术语都非常低P.- 值。

输入参数

全部收缩

线性回归模型,指定为LinearModel使用的对象Fitlm.stepwiselm

从回归模型中删除的术语mdl,指定为以下之一:

  • 字符矢量或字符串标量公式Wilkinson表示法代表一个或多个术语。公式中的变量名称必须是有效的matlab®身份标识。

  • 术语矩阵T.的大小T.——- - - - - -P., 在哪里T.是术语数量和数量P.预测变量的数量在吗mdl.的价值T(i,j)是变量的指数j术语一世

    例如,假设mdl有三个变量一种B.,C以该顺序。每一排T.代表一个术语:

    • (0 0 0)- 持续术语或拦截

    • [0 1 0]-B.;同等,a ^ 0 * b ^ 1 * c ^ 0

    • (1 0 1)-* C

    • [2 0 0]-^ 2

    • [0 1 2]-B * (C ^ 2)

removeterms.将一个分类预测器视为单个变量的一组指示器变量。因此,您无法指定从模型中删除的指示变量。如果指定从模型中删除的分类预测or,removeterms.在一个步骤中为预测器删除一组指示器变量。看到使用步骤修改线性回归模型有关描述如何手动创建指示器变量的示例并将每个作为单独变量对待。

输出参数

全部收缩

具有较少项的线性回归模型,返回为LinearModel对象。newmdl.是否使用输入数据和设置的新拟合模型mdl使用指定的条款术语已经从...删除mdl

覆盖输入参数mdl,将新安装的型号分配给mdl

mdl = removeTerms (mdl、条款);

更多关于

全部收缩

Wilkinson表示法

威尔金森表示法描述了模型中的术语。这个符号与模型中的项相关,而不是这些项的乘数(系数)。

威尔金森表示法使用这些符号:

  • +意味着包括下一个变量。

  • -意味着不包括下一个变量。

  • 定义交互,这是术语的份额。

  • *定义交互和所有低阶项。

  • ^将预测器提升到一个指数,就像*重复,所以^还包括较低的术语。

  • ()群体条款。

该表显示了威尔金森表示法的典型例子。

Wilkinson表示法 标准符号中的术语
1 常数(拦截)术语
^ k, 在哪里K.是一个正整数 一种一种2,......,一种K.
A + B. 一种B.
A * B 一种B.A * B
A: B A * B只有
-B. 不包括B.
A * B + C 一种B.CA * B
A + b + c + A: b 一种B.CA * B
a * b * c - a:b:c 一种B.CA * B* C公元前
* (B + C) 一种B.CA * B* C

统计和机器学习工具箱™符号始终包含常量术语,除非您明确地删除术语-1

有关更多详细信息,请参阅Wilkinson表示法

算法

  • removeterms.处理分类预测器,如下所示:

    • 具有分类预测指标的模型L.级别(类别)包括L.- 1指示器变量。该模型使用第一类作为参考级别,因此它不包括参考级别的指示灯。如果分类预测器的数据类型是分类,则可以使用类别并通过使用重新排序类别reordercats自定义参考级别。

    • removeterms.对待一组L.- 1指示器变量作为一个单独的变量。如果您想将指示器变量视为不同的预测变量,可以使用戴维尔.然后在拟合模型时,使用除分类变量参考水平对应的指标变量外的其他指标变量。对于绝对预测器X,如果您指定所有列dummyvar (X)并以截距项作为预测因子,使设计矩阵秩亏缺。

    • 连续预测因子与分类预测器之间的交互术语L.层次由元素的乘积组成L.- 1具有连续预测器的指示器变量。

    • 两个分类预测因子之间的交互条款L.m水平包括L.- 1)*(m- 1)指标变量包括两个分类预测水平的所有可能组合。

    • 不能为绝对预测器指定高阶项,因为指示器的平方等于它本身。

选择功能

  • 使用stepwiselm在初始模型中指定术语,并继续改进模型,直到没有任何添加或删除术语的步骤是有益的。

  • 使用addterms.将特定术语添加到模型中。

  • 使用通过添加或移除术语来最佳地改进模型。

介绍了R2012a