此示例显示了如何使用分类阵列与分类协变量执行回归GydF4y2BaFitlm.GydF4y2Ba
。GydF4y2Ba
加载GydF4y2BaCarsmall.GydF4y2Ba
变量GydF4y2BaMPG.GydF4y2Ba
含有100加仑样品汽车的里程的测量。每辆车的模型年都在变量中GydF4y2Bamodel_year.GydF4y2Ba
, 和GydF4y2Ba重量GydF4y2Ba
包含每辆车的重量。GydF4y2Ba
绘制一个散点图GydF4y2BaMPG.GydF4y2Ba
反对GydF4y2Ba重量GydF4y2Ba
,按模型年分组。GydF4y2Ba
图()g箭头(重量,mpg,model_year,GydF4y2Ba'bgr'GydF4y2Ba那GydF4y2Ba'x.o'GydF4y2Ba) 标题(GydF4y2Ba'MPG与重量,由模型年分组'GydF4y2Ba)GydF4y2Ba
分组变量,GydF4y2Bamodel_year.GydF4y2Ba
,有三个独特的价值,GydF4y2Ba70GydF4y2Ba
那GydF4y2Ba76.GydF4y2Ba
, 和GydF4y2Ba82.GydF4y2Ba
,对应于1970年,1976年和1982年的模型。GydF4y2Ba
创建包含变量的表GydF4y2BaMPG.GydF4y2Ba
那GydF4y2Ba重量GydF4y2Ba
, 和GydF4y2Bamodel_year.GydF4y2Ba
。转换变量GydF4y2Bamodel_year.GydF4y2Ba
到一个分类的数组。GydF4y2Ba
汽车=表(MPG,重量,model_year);cars.model_year =分类(cars.model_year);GydF4y2Ba
使用回归模型GydF4y2BaFitlm.GydF4y2Ba
和GydF4y2BaMPG.GydF4y2Ba
作为从属变量,和GydF4y2Ba重量GydF4y2Ba
和GydF4y2Bamodel_year.GydF4y2Ba
作为独立变量。因为GydF4y2Bamodel_year.GydF4y2Ba
是一个有三个级别的分类协变量,它应该输入模型作为两个指示器变量。GydF4y2Ba
散点图表明坡度GydF4y2BaMPG.GydF4y2Ba
反对GydF4y2Ba重量GydF4y2Ba
每个模型年可能不同。为了评估这一点,包括权重互动条款。GydF4y2Ba
拟议的模型是GydF4y2Ba
在哪里GydF4y2Ba一世GydF4y2Ba[1976]和GydF4y2Ba一世GydF4y2Ba[1982]是否分别表示模型年1976年和1982年的虚拟变量。GydF4y2Ba一世GydF4y2Ba[1976]如果模型年为1976年,则取值1,如果不是,则占用值0。GydF4y2Ba一世GydF4y2Ba[1982]如果模型年为1982,则取值1,如果不是,则占用值0。在这个模型中,1970年是参考年份。GydF4y2Ba
适合= fitlm(汽车,GydF4y2Ba'MPG〜重量* model_year'GydF4y2Ba)GydF4y2Ba
适合=线性回归模型:MPG〜1个+重量* Model_Year估计系数:估计SE ___________ __________(截距)37.399 2.1466重量-0.0058437 0.00061765 Model_Year_76 4.6903 2.8538 Model_Year_82 21.051 4.157重量:Model_Year_76 -0.00082009 0.00085468重量:Model_Year_82 -0.0050551 0.0015636 TSTAT p值__________________(拦截)17.423 2.8607E-30重量-9.4612 4.6077E-15 Model_Year_76 1.6435 0.10384 Model_Year_82 5.0641 2.2364E-06重量:Model_Year_76 -0.95953 0.33992重量:Model_year_82 -3.2329 0.0017256观察数:94,误差自由度:88根平均方形误差:2.79 R线:0.886,调整R线:0.88 F统计与常数型号:137,P值= 5.79E-40GydF4y2Ba
回归输出显示:GydF4y2Ba
Fitlm.GydF4y2Ba
承认GydF4y2Bamodel_year.GydF4y2Ba
作为分类变量,并构建所需的指示符(虚拟)变量。默认情况下,第一级,GydF4y2Ba70GydF4y2Ba
,是参考组(使用GydF4y2Ba雷德斯GydF4y2Ba
更改参考组))。GydF4y2Ba
模型规格,GydF4y2BaMPG〜体重* Model_yearGydF4y2Ba
,指定一阶术语GydF4y2Ba重量GydF4y2Ba
和GydF4y2Bamodel_year.GydF4y2Ba
以及所有互动。GydF4y2Ba
该模型GydF4y2BaR.GydF4y2Ba2GydF4y2Ba= 0.886,意味着当您考虑体重,模型年和互动时,每加仑数英里的变化减少了88.6%。GydF4y2Ba
适合的模型是GydF4y2Ba
因此,模型岁年的估计回归方程如下。GydF4y2Ba
模型年份GydF4y2Ba | 预测重量的MPGGydF4y2Ba |
---|---|
1970年GydF4y2Ba |
|
1976年GydF4y2Ba |
|
1982年GydF4y2Ba |
|
之间的关系GydF4y2BaMPG.GydF4y2Ba
和GydF4y2Ba重量GydF4y2Ba
随着模型年的增加,有一个越来越负的斜坡。GydF4y2Ba
绘制数据和装配回归线。GydF4y2Ba
W = Linspace(min(重量),最大(重量));图()g箭头(重量,mpg,model_year,GydF4y2Ba'bgr'GydF4y2Ba那GydF4y2Ba'x.o'GydF4y2Ba)线(W,Feval(Fit,W,GydF4y2Ba'70'GydF4y2Ba),GydF4y2Ba'颜色'GydF4y2Ba那GydF4y2Ba'B'GydF4y2Ba那GydF4y2Ba'行宽'GydF4y2Ba2)线(W,Feval(Fit,W,GydF4y2Ba'76'GydF4y2Ba),GydF4y2Ba'颜色'GydF4y2Ba那GydF4y2Ba'G'GydF4y2Ba那GydF4y2Ba'行宽'GydF4y2Ba2)线(W,Feval(Fit,W,GydF4y2Ba'82'GydF4y2Ba),GydF4y2Ba'颜色'GydF4y2Ba那GydF4y2Ba'r'GydF4y2Ba那GydF4y2Ba'行宽'GydF4y2Ba,2)标题(GydF4y2Ba'按模型年份的拟合回归线'GydF4y2Ba)GydF4y2Ba
测试斜坡之间的显着差异。这相当于测试假设GydF4y2Ba
ANOVA(适合)GydF4y2Ba
ANS = SUMSQ DF PERICEQ F PVALUE重量2050.2 1 2050.2 263.87 3.2055E-28 MODEM_YEAR 807.69 2 403.84 51.976 1.2494C-15重量:MODEM_YEAR 81.219 2 40.609 5.2266 0.20 40.609 5.2266 0.0071637错误683.74 88 7.7698GydF4y2Ba
0.0072GydF4y2Ba
(来自互动行,GydF4y2Ba重量:model_year.GydF4y2Ba
),所以零假设在0.05显着性水平下被拒绝。测试统计的价值是GydF4y2Ba5.2266GydF4y2Ba
。测试的分子自由度是GydF4y2Ba2GydF4y2Ba
,这是空假设中的系数数。GydF4y2Ba
有足够的证据表明,斜坡对所有三个型号不等。GydF4y2Ba
Anova.GydF4y2Ba
|GydF4y2Ba分类GydF4y2Ba
|GydF4y2BaFitlm.GydF4y2Ba
|GydF4y2Ba雷德斯GydF4y2Ba