主要内容

removeterms.

从广义线性回归模型中删除术语

描述

例子

newmdl.= removeterms(mdl条款的)返回使用输入数据和设置拟合的广义线性回归模型mdl凭借这些条款条款删除了。

例子

全部折叠

使用两个预测器创建广义线性回归模型,然后删除一个预测器。

使用具有两个潜在预测因子的泊松随机数生成样本数据X (: 1)X (:, 2)

rng (“默认”的)%的再现性rndvars = randn (100 2);X = [2 + rndvars(:,1),rndvars(:,2)];mu = exp(1 + X*[1;2]);y = poissrnd(μ);

创建泊松数据的广义线性回归模型。

mdl = fitglm(x,y,'y〜x1 + x2''分配''泊松'的)
MDL =广义线性回归模型:日志(y)的〜1 + X1 + X2分布=泊松估计系数:估计SE TSTAT p值________ _________ ______(截距)1.0405 0.022122 47.034 0 X1 0.9968 0.003362 296.49 0×2 1.987 0.0063433 313.24 0 100观察,97个误差自由度分散:1 chi ^ 2统计与常数型号:2.95e + 05,p值= 0

从模型中移除第二个预测因子。

mdl1 = removeterms(mdl,“x2”的)
MDL1 =广义线性回归模型:log(y)〜1 + x1分布=泊松估计系数:估计se tstat pvalue ______________ _____________________________________:1 CHI ^ 2统计与常数型号:1.25E + 05,P值= 0

输入参数

全部折叠

广义线性回归模型,指定为GeneralizedLinearModel.使用的对象使用Fitglm.挺身油

从回归模型中删除的术语mdl,指定为以下之一:

  • 字符矢量或字符串标量公式Wilkinson表示法代表一个或多个术语。公式中的变量名称必须是有效的MATLAB®身份标识。

  • 术语矩阵T.的大小T.——- - - - - -P., 在哪里T.是多少项和P.预测变量的数量在吗mdl.的价值T(i,j)是变量的指数j术语一世

    例如,假设mdl有三个变量一种B.,C以该顺序。每一排T.代表一个术语:

    • (0 0 0)- 持续术语或拦截

    • [0 1 0]-B.;同等,a ^ 0 * b ^ 1 * c ^ 0

    • (1 0 1)-* C

    • [2 0 0]-^ 2

    • [0 1 2]-B * (C ^ 2)

removeterms.将一组指标性变量作为一个单独的变量来处理。因此,您不能指定要从模型中删除的指标变量。如果你指定了一个要从模型中移除的分类预测器,removeterms.在一步中删除预测器的一组指示器变量。

输出参数

全部折叠

术语的概括线性回归模型,术语较少,作为a返回GeneralizedLinearModel.对象。newmdl.是否使用输入数据和设置的新拟合模型mdl使用指定的条款条款已经从...删除mdl

覆盖输入参数mdl,将新安装的模型分配给mdl

mdl = removeTerms (mdl、条款);

更多关于

全部折叠

Wilkinson表示法

威尔金森表示法描述了模型中的术语。这个符号与模型中的项相关,而不是这些项的乘数(系数)。

威尔金森表示法使用这些符号:

  • +手段包括下一个变量。

  • -手段不包括下一个变量。

  • 定义交互,这是术语的份额。

  • *定义交互作用和所有低阶项。

  • ^将预测器提升到一个指数,就像*重复,所以^也包括低阶项。

  • ()群体条款。

该表显示了威尔金森表示法的典型例子。

Wilkinson表示法 标准符号术语
1 常数(拦截)术语
X1 ^ K., 在哪里K.是一个正整数 X1X12,......,X1K.
x1 + x2 X1X2.
x1 * x2 X1X2.x1 * x2
x1, x2 x1 * x2只有
-x2 不包括X2.
x1 * x2 + x3 X1X2.X3x1 * x2
x1 + x2 + x3 + x1:x2 X1X2.X3x1 * x2
x1 * x2 * x3 - x1:x2:x3 X1X2.X3x1 * x2x1 * x3x2 * x3
x1 *(x2 + x3) X1X2.X3x1 * x2x1 * x3

有关更多详细信息,请参阅Wilkinson表示法

算法

  • removeterms.处理分类预测器,如下所示:

    • 具有分类预测指标的模型L.级别(类别)包括L.- 1指示器变量。该模型使用第一个类别作为参考级别,因此它不包括参考级别的指示变量。如果分类预测器的数据类型是分类,则可以使用类别并通过使用重新排序类别reordercats自定义参考级别。有关创建指示器变量的更多详细信息,请参阅虚拟变量的自动创建

    • removeterms.对待一组L.- 1指示器变量作为一个单独的变量。如果您想将指示器变量视为不同的预测变量,可以使用戴维尔.然后在拟合模型时,使用除分类变量参考水平对应的指标变量外的其他指标变量。对于绝对预测器X,如果指定所有列dummyvar (X)并以截距项作为预测因子,使设计矩阵秩亏缺。

    • 连续预测因子与分类预测因子之间的交互术语L.层次由元素的乘积组成L.- 1具有连续预测器的指示器变量。

    • 两个分类预测因子之间的交互术语L.M.级别包括L.- 1)*(M.- 1)指标变量包括两个分类预测水平的所有可能组合。

    • 不能为绝对预测器指定高阶项,因为指示器的平方等于它本身。

选择功能

  • 使用挺身油在初始模型中指定术语,并继续改进模型,直到没有任何添加或删除术语的步骤是有益的。

  • 使用addterms.将特定术语添加到模型中。

  • 使用通过添加或删除术语来最佳地改进模型。

扩展能力

介绍了R2012a