主要内容

F统计和T型统计

f统计量

目的

在线性回归中,F统计是用于差异分析(ANOVA)方法的测试统计,以测试模型或模型中的组件的重要性。

定义

线性模型输出显示中的F统计是测试模型统计显着性的测试统计。f级统计值Anova.显示器用于评估模型中术语或组件的重要性。

如何

获得拟合模型后,说,MDL., 使用Fitlm.步骤行程, 你可以:

  • 找出F统计与常量模型在输出显示器或使用

    disp (mdl)
  • 显示模型的ANOVA

    ANOVA(MDL,'摘要')
  • 除了常数期限之外,可以获得组件的F统计值

    ANOVA(MDL)
    有关详细信息,请参阅Anova.方法的方法linearmodel.班级。

使用F统计评估模型的适合

此示例显示如何使用F统计评估模型的拟合和回归系数的重要性。

加载样本数据。

加载医院TBL =桌(医院,医院。重量,医院,医院。伯克,医院。伯化妆压(:,1),......'variablenames',{'年龄''重量'“吸烟者”'血压'});tbl.smoker =分类(tbl.smoker);

适合线性回归模型。

mdl = fitlm(tbl,'血压〜年龄*重量+吸烟+重量^ 2'
MDL =线性回归模型:血压〜1 +吸烟+年龄*重量+重量^ 2估计系数:估计系数__________________________________________________2.0099 0.047305吸烟9.8027 1.0256 9.5584 1.5969E-15年龄:重量0.00021796 0.025258 0.086294 0.93142重量^ 0.0021877 0.0021877 0.0021877 0.0021877 0.0021877 0.00110375观测数量:100,误差自由度:94根均匀误差:4.73 r断层:0.528,调整r-Squared:0.503 F统计与常数型号:21,P值= 4.81e-14

线性配合与恒定模型的F型统计为21,具有21个P.- 4.81e-14的价值。该模型在5%的重要性水平下显着。0.528的R线值意味着该模型解释了响应变异性的约53%。可能存在不包括在当前模型中的其他预测值(解释性)变量。

显示拟合模型的ANOVA表。

ANOVA(MDL,'概括'
ans =.5×5表SUMSQ DF均衡Q ________________________________________________________________________________________25.062型号2354.5 5 470.9 21.012 4.8099E-14。线性2263.3 3 754.42 33.663 7.2417E-15。非线性91.248 2 45.624 2.0358 0.1363剩余2106.6 94 22.411

这显示器将模型中的可变性分成线性和非线性术语。由于有两种非线性术语(重量^ 2.和之间的相互作用重量年龄),非线性自由度DF.列为2.模型中有三个线性术语(一个吸烟者指示器变量,重量, 和年龄)。相应的F统计数据F柱用于测试线性和非线性术语作为单独组的重要性。

当有复制的观察时,残留项也分为两部分;首先是由于缺乏适合而出错,第二是从复制的观察中获得的模型无关的纯错误。在这种情况下,F统计是用于测试缺乏契合,即拟合是足够的。但是,在此示例中,没有复制的观察。

显示模型术语的ANOVA表。

ANOVA(MDL)
ans =.6×5表SUMSQ DF MeanSq˚Fp值________ __ ________ _________ __________年龄62.991 1 62.991 2.8107 0.096959重量0.064104 1 0.064104 0.0028604 0.95746吸烟者2047.5 1 2047.5 91.363 1.5969e-15年龄:重量0.16689 1 0.16689 0.0074466 0.93142重量^ 2 88.057 1 88.057 3.9292 0.050375错误2106.6 9422.411

此显示将ANOVA表分解为模型术语。相应的F统计数据F列评估每个术语的统计学意义。例如,F-Test for吸烟者测试是否为指示器变量的系数吸烟者与零不同。也就是说,F检验决定了吸烟者是否有重大影响血压.每个模型项的自由度是对应f检验的分子自由度。所有的项都有一个自由度。在分类变量的情况下,自由度是指标变量的个数。吸烟者只有一个指示灯变量,所以它也有一种自由度。

t统计

目的

在线性回归,T.- 术用于对回归系数的推断有用。关于系数的假设试验一世测试空假设,即它等于零 - 意味着相应的术语不是显着的 - 与替代假设相比,系数与零不同。

定义

用于对系数的假设测试一世, 和

H0.β一世= 0.

H1β一世≠0,

T.- 术是:

T. = B. 一世 S. E. B. 一世

在哪里SE.B.一世)是估计系数的标准误差B.一世

如何

获得拟合模型后,说,MDL., 使用Fitlm.步骤行程, 你可以:

  • 找到系数估计,估计的标准错误(SE.),和T.- 相应系数的假设检验的典型值(Tstat.)在输出显示中。

  • 呼叫显示使用

    显示(MDL)

使用T型统计评估回归系数的重要性

此示例显示如何使用T型统计测试回归系数的重要性。

加载样本数据并拟合线性回归模型。

加载halMDL = FITLM(成分,加热)
MDL =线性回归模型为:y〜1个+ X1 + X2 + X3 + X4估计系数:估计SE TSTAT p值________ _______ ________(截距)62.405 70.071 0.8906 0.39913 X1 1.5511 0.74477 2.0827 0.070822×2 0.51017 0.72379 0.70486 0.5009×3 0.10191 0.75471 0.13503 0.89592X4 -0.14406 0.70905 -0.20317 0.84407 0.84407观测数量:13,误差自由度:8根均匀误差:2.45 r断层:0.982,调整R线:0.974 F统计与常数型号:111,p值= 4.76e-07

你可以看到,对于每个系数,tstat =估计/ se.这 P. -Values用于假设测试pvalue.柱子。每个 T. - 在模型中给出的其他术语的每个术语的重要性 - 术语。根据这些结果,虽然模型的R线值在0.97时,但没有一个系数在5%的显着性水平上显而易见。这通常表示预测器变量中可能的多色性。

使用逐步回归来确定模型中包含哪些变量。

加载halMDL =步骤(成分,加热)
1.添加x4,fstat = 22.7985,pvalue = 0.000576232 2.添加x1,fstat = 108.2239,pvalue = 1.105281e-06
MDL =线性回归模型:Y〜1 + X1 + X4估计系数:估计系数PVALUE ________ _________________________________________________________________________0.61395 0.048645 -12.61395 0.048645 -12.61395 0.048645 -12.61395-07观察次数:13,自由误差:10根均匀误差:2.73 R线:0.972,调整R线:0.967 F统计与常数型号:177,P值= 1.58E-08

在这个例子中,步骤行程从常量模型开始(默认),并使用正向选择逐步添加X4X1.在最终模型中的每个预测变量鉴于模型中的另一个是重要的。在模型中不显着提高其他预测变量时,算法停止。有关逐步回归的详细信息,请参阅步骤行程

也可以看看

|||||

相关的话题