主要内容

addTerms

添加条件线性回归模型

描述

例子

NewMdl= addTerms (mdl,条款)返回一个线性回归模型拟合使用的输入数据和设置mdl与条款条款补充道。

例子

全部折叠

创建一个线性回归模型carsmall数据集没有任何交互,然后添加一个交互项。

加载carsmall英里/加仑的数据集,并创建一个模型权重的函数和模型。

负载carsmall台=表(MPG、重量);资源描述。年=分类(Model_Year);mdl = fitlm(资源描述,“MPG ~年+重量^ 2”)
mdl =线性回归模型:MPG ~体重重量1 + +年+ ^ 2估计系数:估计SE tStat pValue __________ __________和__________(拦截)e-19重量-0.016404 0.0031249 -5.2493 2.6648 54.206 4.7117 11.505 1.0283 e-06 Year_76 Year_82 0.0044137 2.0887 0.71491 2.9215 8.1864 0.81531 10.041 1.5573 2.6364 e-16体重^ 2 e-06 4.9454 e-07 3.149 - 0.0022303的观察:94年,错误自由度:89根均方误差:2.78平方:0.885,调整平方:0.88 f统计量与常数模型:172年,假定值= 5.52 e-41

模型包括5个方面,拦截,重量,Year_76,Year_82,体重^ 2,在那里Year_76Year_82为分类变量指标变量吗一年有三个不同的值。

添加一个之间的交互项一年重量变量mdl

条款=“年*重量”;NewMdl = addTerms (mdl条款)
NewMdl =线性回归模型:MPG ~ 1 +重量*年+重量^ 2估计系数:估计SE tStat pValue ___________ __________ ________ __________(拦截)48.045 6.779 7.0874 3.3967平台以及体重Year_82 Year_76 0.0030751 -0.012624 0.0041455 -3.0454 2.7768 3.0538 0.90931 0.3657 16.416 4.9802 3.2962 0.0014196重量:Year_76 -0.00020693 0.00092403 -0.22394 0.82333重量:Year_82 6.12 1.0121 -0.0032574 0.0018919 -1.7217 0.088673重量^ 2 e-06 e-07 1.6538 - 0.10177的观察:94年,错误自由度:87根均方误差:2.76平方:0.89,调整平方:0.882 f统计量与常数模型:117年,假定值= 1.88 e-39

NewMdl包含两个附加的条款,重量* Year_76重量* Year_82

输入参数

全部折叠

线性回归模型,指定为一个LinearModel对象创建使用fitlmstepwiselm

的回归模型mdl,指定为以下之一:

  • 特征向量或字符串标量公式威尔金森符号代表一个或多个条件。公式中的变量名必须是有效的MATLAB®标识符。

  • 计算矩阵T的大小t——- - - - - -p,在那里t的条款和数量吗p预测变量的数量吗mdl。的价值T (i, j)是变量的指数吗j在术语

    例如,假设mdl有三个变量一个,B,C这个顺序。每一行的T代表一个术语:

    • (0 0 0)——常数项或拦截

    • (0 1 0)- - - - - -B;同样,^ 0 B * * C ^ 0 ^ 1

    • (1 0 1)- - - - - -* C

    • (2 0 0)- - - - - -^ 2

    • [0 1 2]- - - - - -B * (C ^ 2)

addTerms治疗的一组指标变量的分类预测作为一个变量。因此,您不能指定一个指示符变量添加到模型中。如果你指定一个分类预测的模型,addTerms增加了一组指标变量预测的一个步骤。看到使用步骤修改线性回归模型为例,描述了如何手动创建指标变量和对待每一个人作为一个独立的变量。

输出参数

全部折叠

线性回归模型与附加条款,作为一个返回LinearModel对象。NewMdl是一个新安装的模型,使用输入数据和设置在吗mdl附加的条款中指定条款

覆盖输入参数mdl,分配新模型mdl:

mdl = addTerms (mdl、条款);

更多关于

全部折叠

威尔金森符号

威尔金森符号描述术语出现在一个模型。符号相关条款存在于一个模型,而不是乘数(系数)的条款。

威尔金森符号使用这些符号:

  • +意味着包括下一个变量。

  • - - - - - -意味着不包括下一个变量。

  • :定义了一个交互,这是一个产品的术语。

  • *定义了一个交互和所有低阶项。

  • ^提高预测能力,完全一样*重复,所以^包括低阶项。

  • ()组条件。

此表显示了威尔金森符号的典型例子。

威尔金森符号 在标准符号
1 常数(拦截)
x1 ^ k,在那里k是一个正整数 x1,x12、……x1k
x1 + x2 x1,x2
x1 * x2 x1,x2,x1 * x2
x1, x2 x1 * x2只有
x2 不包括x2
x1 * x2 + x3 x1,x2,x3,x1 * x2
x1 + x2 + x3 + x1, x2 x1,x2,x3,x1 * x2
x1 * x2 * x3 - x1, x2, x3 x1,x2,x3,x1 * x2,x1 * x3,x2 * x3
x1 * (x2 + x3) x1,x2,x3,x1 * x2,x1 * x3

更多细节,请参阅威尔金森符号

算法

  • addTerms对待分类预测如下:

    • 一个模型的分类预测l包括水平(类别)l- 1指标变量。模型使用第一类作为参考水平,所以它不包括参考的指标变量的水平。如果数据类型的分类预测分类,那你可以检查的顺序分类利用类别通过使用和重新排序的类别reordercats自定义参考水平。关于创建指标变量的更多细节,请参阅自动创建虚拟变量

    • addTerms治疗组l- 1作为一个变量指标变量。如果你想把指标变量不同的预测变量,使用手动创建指标变量dummyvar。然后使用指标变量,除了一个对应的参考电平分类变量,当你适应一个模型。的分类预测X如果你指定的所有列dummyvar (X)和一个截距项预测,然后设计矩阵变得不足。

    • 交互条款之间的连续预测和分类预测l由element-wise产品的水平l- 1变量与连续预测指标。

    • 两个分类预测之间的交互方面l水平的(l- 1)* (- 1)指标变量包括所有可能的组合的两个分类预测的水平。

    • 你不能指定高阶术语分类预测,因为一个指标的平方等于本身。

选择功能

  • 使用stepwiselm指定条件的模型和持续改进模型开始,直到没有添加或删除一个术语的一步是有益的。

  • 使用removeTerms从模型中删除具体条款。

  • 使用一步优化改进模型通过添加或删除。

扩展功能

介绍了R2012a