协变量线性回归和分类gydF4y2Ba
这个例子展示了如何执行使用分类数组和协变量的回归和分类gydF4y2BafitlmgydF4y2Ba
。gydF4y2Ba
加载示例数据。gydF4y2Ba
负载gydF4y2BacarsmallgydF4y2Ba
的变量gydF4y2Ba英里/加仑gydF4y2Ba
包含测量样本100英里每加仑的汽车。每辆车的年型变量gydF4y2BaModel_YeargydF4y2Ba
,gydF4y2Ba重量gydF4y2Ba
包含每辆车的重量。gydF4y2Ba
数据分组的阴谋。gydF4y2Ba
画一个散点图gydF4y2Ba英里/加仑gydF4y2Ba
对gydF4y2Ba重量gydF4y2Ba
,按模型分组。gydF4y2Ba
图()gscatter(重量、MPG Model_Year,gydF4y2Ba“bgr”gydF4y2Ba,gydF4y2Ba“x.o”gydF4y2Ba)标题(gydF4y2Ba“MPG和重量,按年型分组”gydF4y2Ba)gydF4y2Ba
分组变量,gydF4y2BaModel_YeargydF4y2Ba
,有三个独特的价值观,gydF4y2Ba70年gydF4y2Ba
,gydF4y2Ba76年gydF4y2Ba
,gydF4y2Ba82年gydF4y2Ba
,对应于模型1970年、1976年和1982年。gydF4y2Ba
创建表和分类数组。gydF4y2Ba
创建一个表,其中包含的变量gydF4y2Ba英里/加仑gydF4y2Ba
,gydF4y2Ba重量gydF4y2Ba
,gydF4y2BaModel_YeargydF4y2Ba
。把变量gydF4y2BaModel_YeargydF4y2Ba
分类数组。gydF4y2Ba
汽车=表(MPG、重量、Model_Year);汽车。米odel_Year = categorical(cars.Model_Year);
适合一个回归模型。gydF4y2Ba
适合一个回归模型使用gydF4y2BafitlmgydF4y2Ba
与gydF4y2Ba英里/加仑gydF4y2Ba
作为因变量,gydF4y2Ba重量gydF4y2Ba
和gydF4y2BaModel_YeargydF4y2Ba
作为独立变量。因为gydF4y2BaModel_YeargydF4y2Ba
与三个层次是一个绝对的协变量,它应进入模型两个指标变量。gydF4y2Ba
散点图显示的斜率gydF4y2Ba英里/加仑gydF4y2Ba
对gydF4y2Ba重量gydF4y2Ba
为每个模型可能不同。评估,包括weight-year交互方面。gydF4y2Ba
该模型是gydF4y2Ba
在哪里gydF4y2Ba我gydF4y2Ba[1976]和gydF4y2Ba我gydF4y2Ba[1982]是虚拟变量指示模型1976年和1982年,分别。gydF4y2Ba我gydF4y2Ba[1976]的值1如果模型是1976年,值0如果不是。gydF4y2Ba我gydF4y2Ba[1982]的值1如果模型是1982年,值0如果不是。在这个模型中,1970是参考。gydF4y2Ba
适合= fitlm(汽车,gydF4y2Ba“MPG ~ * Model_Year重量”gydF4y2Ba)gydF4y2Ba
适合=线性回归模型:MPG ~ 1 +重量* Model_Year估计系数:估计SE ___________ __________(拦截)4.6903 - 2.8538 -0.0058437 - 0.00061765 37.399 - 2.1466重量Model_Year_76 Model_Year_82 21.051 - 4.157重量:Model_Year_76 -0.00082009 - 0.00085468重量:-0.0050551 - 0.0015636 Model_Year_82 tStat pValue ________ __________(拦截)17.423 2.8607 e-30体重-9.4612 - 4.6077 e15汽油Model_Year_76 5.0641 - 2.2364 1.6435 - 0.10384 Model_Year_82 e-06重量:Model_Year_76 -0.95953 - 0.33992重量:-3.2329 - 0.0017256 Model_Year_82观测数量:94年,错误自由度:88根均方误差:2.79平方:0.886,调整平方:0.88 f统计量与常数模型:137年,假定值= 5.79 e-40gydF4y2Ba
回归输出显示:gydF4y2Ba
fitlmgydF4y2Ba
认识到gydF4y2BaModel_YeargydF4y2Ba
作为分类变量,构造所需的指示器(虚拟)变量。默认情况下,第一级,gydF4y2Ba70年gydF4y2Ba
,是参照群体(使用gydF4y2BareordercatsgydF4y2Ba
改变参考集团)。gydF4y2Ba模型的规范,gydF4y2Ba
英里/加仑~ * Model_Year重量gydF4y2Ba
,指定了一阶条件gydF4y2Ba重量gydF4y2Ba
和gydF4y2BaModel_YeargydF4y2Ba
,所有的交互。gydF4y2Ba该模型gydF4y2BaRgydF4y2Ba2gydF4y2Ba英里每加仑= 0.886,这意味着差异当你考虑重量减少了88.6%,模型,和他们的相互作用。gydF4y2Ba
拟合模型gydF4y2Ba
因此,估计回归方程为模型如下。gydF4y2Ba
模型一年gydF4y2Ba 预测MPG对体重gydF4y2Ba 1970年gydF4y2Ba 1976年gydF4y2Ba 1982年gydF4y2Ba
之间的关系gydF4y2Ba英里/加仑gydF4y2Ba
和gydF4y2Ba重量gydF4y2Ba
有一个越来越负斜率随着车型的增加。gydF4y2Ba
情节上回归。gydF4y2Ba
图数据和拟合回归直线。gydF4y2Ba
w = linspace (min(重量),max(重量));图()gscatter(重量、MPG Model_Year,gydF4y2Ba“bgr”gydF4y2Ba,gydF4y2Ba“x.o”gydF4y2Ba)线(w函数宏指令(健康,w,gydF4y2Ba“70”gydF4y2Ba),gydF4y2Ba“颜色”gydF4y2Ba,gydF4y2Ba“b”gydF4y2Ba,gydF4y2Ba“线宽”gydF4y2Ba2)线(w函数宏指令(健康,w,gydF4y2Ba“76”gydF4y2Ba),gydF4y2Ba“颜色”gydF4y2Ba,gydF4y2Ba‘g’gydF4y2Ba,gydF4y2Ba“线宽”gydF4y2Ba2)线(w函数宏指令(健康,w,gydF4y2Ba“82”gydF4y2Ba),gydF4y2Ba“颜色”gydF4y2Ba,gydF4y2Ba“r”gydF4y2Ba,gydF4y2Ba“线宽”gydF4y2Ba2)标题(gydF4y2Ba“拟合回归模型年行”gydF4y2Ba)gydF4y2Ba
测试不同的斜坡。gydF4y2Ba
测试斜坡之间的显著差异。这相当于测试假说gydF4y2Ba
方差分析(适合)gydF4y2Ba
ans = SumSq DF MeanSq F pValue体重2050.2 - 1 2050.2 263.87 3.2055即使Model_Year 807.69 - 2 403.84 51.976 1.2494 e15汽油重量:Model_Year 81.219 - 2 683.74 88 7.7698 40.609 5.2266 0.0071637错误gydF4y2Ba
0.0072gydF4y2Ba
(从交互行,gydF4y2Ba重量:Model_YeargydF4y2Ba
),所以零假设被拒绝在0.05显著性水平。检验统计量的值gydF4y2Ba5.2266gydF4y2Ba
。测试是分子的自由度gydF4y2Ba2gydF4y2Ba
系数的数量的零假设。gydF4y2Ba
有足够的证据表明这三个模型的斜坡上是不平等的年。gydF4y2Ba
另请参阅gydF4y2Ba
fitlmgydF4y2Ba
|gydF4y2Ba分类gydF4y2Ba
|gydF4y2BareordercatsgydF4y2Ba
|gydF4y2Ba方差分析gydF4y2Ba