主要内容

移除

从广义线性回归模型中删除项

描述

实例

新MDL=removems(mdl,条款)返回使用中的输入数据和设置拟合的广义线性回归模型mdl有条件条款远离的。

例子

全部崩溃

使用两个预测因子创建广义线性回归模型,然后删除一个预测因子。

使用具有两个基本预测值的泊松随机数生成样本数据X(:,1)X(:,2).

rng(“默认”)%为了再现性rndvars=randn(100,2);X=[2+rndvars(:,1),rndvars(:,2)];mu=exp(1+X*[1;2]);y=poissrnd(mu);

创建泊松数据的广义线性回归模型。

mdl=fitglm(X,y,‘y~x1+x2’,“分配”,“泊松”)
mdl=广义线性回归模型:对数(y)~1+x1+x2分布=泊松估计系数:估计值为pValue(截距)1.0405 0.022122 47.034 0 x1 0.9968 0.003362 296.49 0 x2 1.987 0.0063433 313.24 0 100个观测值,97个误差自由度离散度:1 Chi^2-统计与常数模型:2.95e+05,p值=0

从模型中删除第二个预测器。

mdl1=最小最小最小值(mdl,“x2”)
mdl1=广义线性回归模型:对数(y)~1+x1分布=泊松估计系数:估计自回归pValue uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu(截距)2.7784 0.014014043 197.85 0 x1 1.1732 0.0033653 348.6 0 100个观测值,98个误差自由度离散度:1 Chi^2-统计常数模型:1.25e+0,p=0.05

输入参数

全部崩溃

广义线性回归模型,指定为广义线性模型使用创建的对象菲特格姆逐步GLM.

要从回归模型中删除的术语mdl,指定为以下内容之一:

  • 中的字符向量或字符串标量公式威尔金森符号表示一个或多个术语。公式中的变量名必须有效®标识符。

  • 术语矩阵T大小T-借-P哪里T是术语和术语的数目P是中的预测变量数mdl.价值T(i,j)是变量的指数J长期.

    例如,假设mdl有三个变量A.,BC按那个顺序。每行T表示一个术语:

    • [0 0 0]-常数项或截距

    • [0 1 0]B;相当于,A^0*B^1*C^0

    • [1 0 1]A*C

    • [2 0 0]A^2

    • [0 1 2]B*(C^2)

移除将分类预测值的一组指标变量视为单个变量。因此,不能指定要从模型中删除的指标变量。如果指定要从模型中删除的分类预测值,移除一步移除预测器的一组指标变量。

输出参数

全部崩溃

具有较少项的广义线性回归模型,返回为广义线性模型对象新MDL是使用中的输入数据和设置的新安装型号mdl按照本协议中规定的条款条款mdl.

覆盖输入参数的步骤mdl,将新安装的模型分配给mdl:

mdl=移动设备(mdl,术语);

更多关于

全部崩溃

威尔金森符号

威尔金森表示法描述模型中的术语。该表示法与模型中的术语相关,而与这些术语的乘数(系数)无关。

威尔金森符号使用以下符号:

  • +表示包含下一个变量。

  • 表示不包括下一个变量。

  • :定义一个交互,它是术语的产物。

  • *定义交互和所有低阶项。

  • ^将预测器提高到幂,与中的完全相同*重复,所以^也包括低阶术语。

  • ()分组术语。

此表显示了威尔金森符号的典型示例。

威尔金森符号 标准符号中的术语
1. 常数(截距)项
x1^k哪里K是一个正整数 x1,x12., ...,x1K
x1+x2 x1,x2
x1*x2 x1,x2,x1*x2
x1:x2 x1*x2只有
–x2 不包括x2
x1*x2+x3 x1,x2,x3,x1*x2
x1+x2+x3+x1:x2 x1,x2,x3,x1*x2
x1*x2*x3–x1:x2:x3 x1,x2,x3,x1*x2,x1*x3,x2*x3
x1*(x2+x3) x1,x2,x3,x1*x2,x1*x3

有关详细信息,请参阅威尔金森符号.

算法

  • 移除将分类预测值处理如下:

    • 具有分类预测因子的模型L级别(类别)包括L– 1指标变量。模型使用第一个类别作为参考级别,因此不包括参考级别的指标变量。如果分类预测值的数据类型为明确的,然后您可以使用类别并使用重装猫自定义参考级别。有关创建指标变量的更多详细信息,请参阅虚拟变量的自动创建.

    • 移除治疗组L– 1指标变量作为单个变量。如果要将指标变量视为不同的预测变量,请使用手动创建指标变量杜姆瓦尔。然后,在拟合模型时,使用指标变量,但与分类变量参考水平相对应的变量除外。对于分类预测值X,如果指定dummyvar(X)和截距项作为预测器,则设计矩阵变得秩亏。

    • 连续预测器和分类预测器之间的相互作用项L级别由以下元素的元素级产品组成:L– 1具有连续预测器的指标变量。

    • 两个分类预测因子之间的相互作用项LM级别包括(L– 1)*(M– 1)指标变量包括两个分类预测水平的所有可能组合。

    • 不能为分类预测值指定高阶项,因为指标的平方等于自身。

替代功能

  • 使用逐步GLM在起始模型中指定术语,并继续改进模型,直到添加或删除术语的单个步骤都不起作用。

  • 使用附加条款将特定术语添加到模型中。

  • 使用通过添加或删除术语来优化模型。

扩展能力

2012年推出