与分类协变量的线性回归GydF4y2Ba

此示例显示了如何使用分类阵列与分类协变量执行回归GydF4y2BaFitlm.GydF4y2Ba。GydF4y2Ba

加载样本数据。GydF4y2Ba

加载GydF4y2BaCarsmall.GydF4y2Ba

变量GydF4y2BaMPG.GydF4y2Ba含有100加仑样品汽车的里程的测量。每辆车的模型年都在变量中GydF4y2Bamodel_year.GydF4y2Ba, 和GydF4y2Ba重量GydF4y2Ba包含每辆车的重量。GydF4y2Ba

绘制分组数据。GydF4y2Ba

绘制一个散点图GydF4y2BaMPG.GydF4y2Ba反对GydF4y2Ba重量GydF4y2Ba,按模型年分组。GydF4y2Ba

图()g箭头(重量,mpg,model_year,GydF4y2Ba'bgr'GydF4y2Ba那GydF4y2Ba'x.o'GydF4y2Ba) 标题(GydF4y2Ba'MPG与重量,由模型年分组'GydF4y2Ba)GydF4y2Ba

分组变量,GydF4y2Bamodel_year.GydF4y2Ba,有三个独特的价值,GydF4y2Ba70GydF4y2Ba那GydF4y2Ba76.GydF4y2Ba, 和GydF4y2Ba82.GydF4y2Ba,对应于1970年,1976年和1982年的模型。GydF4y2Ba

创建表和分类数组。GydF4y2Ba

创建包含变量的表GydF4y2BaMPG.GydF4y2Ba那GydF4y2Ba重量GydF4y2Ba, 和GydF4y2Bamodel_year.GydF4y2Ba。转换变量GydF4y2Bamodel_year.GydF4y2Ba到一个分类的数组。GydF4y2Ba

汽车=表(MPG,重量,model_year);cars.model_year =分类(cars.model_year);GydF4y2Ba

适合回归模型。GydF4y2Ba

使用回归模型GydF4y2BaFitlm.GydF4y2Ba和GydF4y2BaMPG.GydF4y2Ba作为从属变量,和GydF4y2Ba重量GydF4y2Ba和GydF4y2Bamodel_year.GydF4y2Ba作为独立变量。因为GydF4y2Bamodel_year.GydF4y2Ba是一个有三个级别的分类协变量,它应该输入模型作为两个指示器变量。GydF4y2Ba

散点图表明坡度GydF4y2BaMPG.GydF4y2Ba反对GydF4y2Ba重量GydF4y2Ba每个模型年可能不同。为了评估这一点,包括权重互动条款。GydF4y2Ba

拟议的模型是GydF4y2Ba

E.GydF4y2Ba (GydF4y2Ba mGydF4y2Ba P.GydF4y2Ba GGydF4y2Ba )GydF4y2Ba =GydF4y2Ba βGydF4y2Ba 0.GydF4y2Ba +GydF4y2Ba βGydF4y2Ba 1GydF4y2Ba W.GydF4y2Ba E.GydF4y2Ba 一世GydF4y2Ba GGydF4y2Ba HGydF4y2Ba T.GydF4y2Ba +GydF4y2Ba βGydF4y2Ba 2GydF4y2Ba 一世GydF4y2Ba [GydF4y2Ba 1976年GydF4y2Ba ]GydF4y2Ba +GydF4y2Ba βGydF4y2Ba 3.GydF4y2Ba 一世GydF4y2Ba [GydF4y2Ba 1982年GydF4y2Ba ]GydF4y2Ba +GydF4y2Ba βGydF4y2Ba 4.GydF4y2Ba W.GydF4y2Ba E.GydF4y2Ba 一世GydF4y2Ba GGydF4y2Ba HGydF4y2Ba T.GydF4y2Ba ×GydF4y2Ba 一世GydF4y2Ba [GydF4y2Ba 1976年GydF4y2Ba ]GydF4y2Ba +GydF4y2Ba βGydF4y2Ba 5.GydF4y2Ba W.GydF4y2Ba E.GydF4y2Ba 一世GydF4y2Ba GGydF4y2Ba HGydF4y2Ba T.GydF4y2Ba ×GydF4y2Ba 一世GydF4y2Ba [GydF4y2Ba 1982年GydF4y2Ba ]GydF4y2Ba 那GydF4y2Ba

在哪里GydF4y2Ba一世GydF4y2Ba[1976]和GydF4y2Ba一世GydF4y2Ba[1982]是否分别表示模型年1976年和1982年的虚拟变量。GydF4y2Ba一世GydF4y2Ba[1976]如果模型年为1976年,则取值1,如果不是,则占用值0。GydF4y2Ba一世GydF4y2Ba[1982]如果模型年为1982,则取值1,如果不是,则占用值0。在这个模型中,1970年是参考年份。GydF4y2Ba

适合= fitlm(汽车,GydF4y2Ba'MPG〜重量* model_year'GydF4y2Ba)GydF4y2Ba
适合=线性回归模型:MPG〜1个+重量* Model_Year估计系数:估计SE ___________ __________(截距)37.399 2.1466重量-0.0058437 0.00061765 Model_Year_76 4.6903 2.8538 Model_Year_82 21.051 4.157重量:Model_Year_76 -0.00082009 0.00085468重量:Model_Year_82 -0.0050551 0.0015636 TSTAT p值__________________(拦截)17.423 2.8607E-30重量-9.4612 4.6077E-15 Model_Year_76 1.6435 0.10384 Model_Year_82 5.0641 2.2364E-06重量:Model_Year_76 -0.95953 0.33992重量:Model_year_82 -3.2329 0.0017256观察数:94,误差自由度:88根平均方形误差:2.79 R线:0.886,调整R线:0.88 F统计与常数型号:137,P值= 5.79E-40GydF4y2Ba

回归输出显示:GydF4y2Ba

  • Fitlm.GydF4y2Ba承认GydF4y2Bamodel_year.GydF4y2Ba作为分类变量,并构建所需的指示符(虚拟)变量。默认情况下,第一级,GydF4y2Ba70GydF4y2Ba,是参考组(使用GydF4y2Ba雷德斯GydF4y2Ba更改参考组))。GydF4y2Ba

  • 模型规格,GydF4y2BaMPG〜体重* Model_yearGydF4y2Ba,指定一阶术语GydF4y2Ba重量GydF4y2Ba和GydF4y2Bamodel_year.GydF4y2Ba以及所有互动。GydF4y2Ba

  • 该模型GydF4y2BaR.GydF4y2Ba2GydF4y2Ba= 0.886,意味着当您考虑体重,模型年和互动时,每加仑数英里的变化减少了88.6%。GydF4y2Ba

  • 适合的模型是GydF4y2Ba

    mGydF4y2Ba P.GydF4y2Ba ^GydF4y2Ba GGydF4y2Ba =GydF4y2Ba 37.4GydF4y2Ba -GydF4y2Ba 0.006.GydF4y2Ba W.GydF4y2Ba E.GydF4y2Ba 一世GydF4y2Ba GGydF4y2Ba HGydF4y2Ba T.GydF4y2Ba +GydF4y2Ba 4.7GydF4y2Ba 一世GydF4y2Ba [GydF4y2Ba 1976年GydF4y2Ba ]GydF4y2Ba +GydF4y2Ba 21.1.GydF4y2Ba 一世GydF4y2Ba [GydF4y2Ba 1982年GydF4y2Ba ]GydF4y2Ba -GydF4y2Ba 0.0008GydF4y2Ba W.GydF4y2Ba E.GydF4y2Ba 一世GydF4y2Ba GGydF4y2Ba HGydF4y2Ba T.GydF4y2Ba ×GydF4y2Ba 一世GydF4y2Ba [GydF4y2Ba 1976年GydF4y2Ba ]GydF4y2Ba -GydF4y2Ba 0.005.GydF4y2Ba W.GydF4y2Ba E.GydF4y2Ba 一世GydF4y2Ba GGydF4y2Ba HGydF4y2Ba T.GydF4y2Ba ×GydF4y2Ba 一世GydF4y2Ba [GydF4y2Ba 1982年GydF4y2Ba ]GydF4y2Ba 。GydF4y2Ba

    因此,模型岁年的估计回归方程如下。GydF4y2Ba

    模型年份GydF4y2Ba 预测重量的MPGGydF4y2Ba
    1970年GydF4y2Ba

    mGydF4y2Ba P.GydF4y2Ba ^GydF4y2Ba GGydF4y2Ba =GydF4y2Ba 37.4GydF4y2Ba -GydF4y2Ba 0.006.GydF4y2Ba W.GydF4y2Ba E.GydF4y2Ba 一世GydF4y2Ba GGydF4y2Ba HGydF4y2Ba T.GydF4y2Ba

    1976年GydF4y2Ba

    mGydF4y2Ba P.GydF4y2Ba ^GydF4y2Ba GGydF4y2Ba =GydF4y2Ba (GydF4y2Ba 37.4GydF4y2Ba +GydF4y2Ba 4.7GydF4y2Ba )GydF4y2Ba -GydF4y2Ba (GydF4y2Ba 0.006.GydF4y2Ba +GydF4y2Ba 0.0008GydF4y2Ba )GydF4y2Ba W.GydF4y2Ba E.GydF4y2Ba 一世GydF4y2Ba GGydF4y2Ba HGydF4y2Ba T.GydF4y2Ba

    1982年GydF4y2Ba

    mGydF4y2Ba P.GydF4y2Ba ^GydF4y2Ba GGydF4y2Ba =GydF4y2Ba (GydF4y2Ba 37.4GydF4y2Ba +GydF4y2Ba 21.1.GydF4y2Ba )GydF4y2Ba -GydF4y2Ba (GydF4y2Ba 0.006.GydF4y2Ba +GydF4y2Ba 0.005.GydF4y2Ba )GydF4y2Ba W.GydF4y2Ba E.GydF4y2Ba 一世GydF4y2Ba GGydF4y2Ba HGydF4y2Ba T.GydF4y2Ba

之间的关系GydF4y2BaMPG.GydF4y2Ba和GydF4y2Ba重量GydF4y2Ba随着模型年的增加,有一个越来越负的斜坡。GydF4y2Ba

绘制拟合回归线。GydF4y2Ba

绘制数据和装配回归线。GydF4y2Ba

W = Linspace(min(重量),最大(重量));图()g箭头(重量,mpg,model_year,GydF4y2Ba'bgr'GydF4y2Ba那GydF4y2Ba'x.o'GydF4y2Ba)线(W,Feval(Fit,W,GydF4y2Ba'70'GydF4y2Ba),GydF4y2Ba'颜色'GydF4y2Ba那GydF4y2Ba'B'GydF4y2Ba那GydF4y2Ba'行宽'GydF4y2Ba2)线(W,Feval(Fit,W,GydF4y2Ba'76'GydF4y2Ba),GydF4y2Ba'颜色'GydF4y2Ba那GydF4y2Ba'G'GydF4y2Ba那GydF4y2Ba'行宽'GydF4y2Ba2)线(W,Feval(Fit,W,GydF4y2Ba'82'GydF4y2Ba),GydF4y2Ba'颜色'GydF4y2Ba那GydF4y2Ba'r'GydF4y2Ba那GydF4y2Ba'行宽'GydF4y2Ba,2)标题(GydF4y2Ba'按模型年份的拟合回归线'GydF4y2Ba)GydF4y2Ba

测试不同的斜坡。GydF4y2Ba

测试斜坡之间的显着差异。这相当于测试假设GydF4y2Ba

HGydF4y2Ba 0.GydF4y2Ba :GydF4y2Ba βGydF4y2Ba 4.GydF4y2Ba =GydF4y2Ba βGydF4y2Ba 5.GydF4y2Ba =GydF4y2Ba 0.GydF4y2Ba HGydF4y2Ba 一种GydF4y2Ba :GydF4y2Ba βGydF4y2Ba 一世GydF4y2Ba ≠GydF4y2Ba 0.GydF4y2Ba 为了GydF4y2Ba 在GydF4y2Ba 至少GydF4y2Ba 一GydF4y2Ba 一世GydF4y2Ba 。GydF4y2Ba

ANOVA(适合)GydF4y2Ba
ANS = SUMSQ DF PERICEQ F PVALUE重量2050.2 1 2050.2 263.87 3.2055E-28 MODEM_YEAR 807.69 2 403.84 51.976 1.2494C-15重量:MODEM_YEAR 81.219 2 40.609 5.2266 0.20 40.609 5.2266 0.0071637错误683.74 88 7.7698GydF4y2Ba
这个输出显示了GydF4y2BaP.GydF4y2Ba-Value用于测试是GydF4y2Ba0.0072GydF4y2Ba(来自互动行,GydF4y2Ba重量:model_year.GydF4y2Ba),所以零假设在0.05显着性水平下被拒绝。测试统计的价值是GydF4y2Ba5.2266GydF4y2Ba。测试的分子自由度是GydF4y2Ba2GydF4y2Ba,这是空假设中的系数数。GydF4y2Ba

有足够的证据表明,斜坡对所有三个型号不等。GydF4y2Ba

也可以看看GydF4y2Ba

|GydF4y2Ba|GydF4y2Ba|GydF4y2Ba

相关例子GydF4y2Ba

更多关于GydF4y2Ba