主要内容

f统计量和t统计量

f统计量

目的

在线性回归,f统计量的检验统计量方差分析(方差分析)的方法来测试模型的意义或组件模型。

定义

f统计量的线性模型输出显示的统计测试模型的统计学意义。模型属性ModelFitVsNullModel包含相同的数据。

的f统计量的值方差分析显示让你评估条款的意义或组件的模型。

如何

适合一个回归模型(mdl)通过使用fitlmstepwiselm。然后,您可以:

  • 找到f统计量与常数模型在输出中显示或使用

    disp (mdl)
  • 通过输入显示的f统计量模型

    mdl.ModelFitVsNullModel
  • 使用显示的方差分析模型

    方差分析(mdl“摘要”)
  • 获取组件的f统计量的值,除了使用常数项

    方差分析(mdl)
    详情,请参阅方差分析的方法LinearModel类。

评估使用f统计量的模型

这个例子展示了如何评估模型的适应和使用f统计量的回归系数的意义。

加载示例数据。

负载医院台=表(hospital.Age hospital.Weight、hospital.Smoker hospital.BloodPressure (: 1),“VariableNames”,{“年龄”,“重量”,“抽烟”,“血压”});资源描述。年代moker = categorical(tbl.Smoker);

适合一个线性回归模型。

mdl = fitlm(资源描述,的血压~年龄*重量+吸烟者+重量^ 2》)
mdl =线性回归模型:血压~ 1 +吸烟者+年龄*重量+体重^ 2估计系数:估计SE tStat pValue __________ _____ ________ __________(拦截)168.02 27.694 6.067 2.7149 e-08年龄Smoker_true重量0.079569 0.39861 0.19962 0.84221 -0.69041 0.3435 -2.0099 0.047305 9.8027 1.0256 9.5584 1.5969 e15汽油年龄:体重0.00021796 ^ 2 0.0021877 0.0011037 1.9822 0.050375 0.0025258 0.086294 0.93142重量数量的观察:100年,错误自由度:94根均方误差:4.73平方:0.528,调整平方:0.503 f统计量与常数模型:21岁的假定值= 4.81 e-14

f统计量的线性适应与常数模型是21日的p4.81 e-14的价值。该模型在5%的显著性水平具有重要意义。的平方值为0.528时表示模型解释了在响应中约53%的变异性。可能有其他预测变量(解释),不包括在当前的模型。

您也可以通过编程方式访问模型的f统计量。

mdl.ModelFitVsNullModel
ans =结构体字段:函数:21.0120 Pvalue: 4.8099 e-14 NullModel:“常数”

显示拟合模型的方差分析表。

方差分析(mdl“摘要”)
ans =5×5表SumSq DF MeanSq F pValue ______ __交__________ 99 4461.2 45.062 4.8099 470.9 - 21.012 2354.5 - 5 e-14模型。线性e15汽油7.2417 754.42 - 33.663 2263.3 - 3。非线性91.248 94 22.411 2106.6 45.624 2.0358 0.1363残留

这显示分离模型转换为线性和非线性的变化。因为有两个非线性术语(体重^ 2和之间的交互重量年龄),非线性的自由度DF列是2。有三个线性模型中(一个条款吸烟者指标变量,重量,年龄)。中相应的统计量F列测试线性和非线性项的重要性作为单独的组。

当有重复观察,残余项也分为两个部分;第一个错误是由于缺乏健康,其次是纯误差独立于模型,从复制获得观测。在这种情况下,f统计量是用于测试缺乏健康,也就是说,是否适合是足够的。但是,在这个例子中,没有重复的观察。

显示模型的方差分析表。

方差分析(mdl)
ans =6×5表__________ SumSq DF MeanSq F pValue ________ __ ________ ____年龄体重62.991 - 1 62.991 2.8107 0.096959 0.064104 2047.5 0.064104 0.0028604 0.95746吸烟者1 2047.5 91.363 1.5969 e15汽油年龄:重量0.16689 - 1 0.16689 0.0074466 0.93142重量2 ^ 88.057 - 1 88.057 3.9292 0.050375 2106.6 94 22.411错误

这显示分解模型的方差分析表。中相应的统计量F列评估每一项的统计显著性。例如,野生的吸烟者测试是否指示符变量的系数吸烟者不同于零。即野生决定作为一个烟民有显著的影响血压。每个模型的自由度术语对应的野生的分子的自由度。所有条款都一个自由度。对于分类变量,自由度是变量的数量指标。吸烟者只有一个指标变量,所以它也有一个自由度。

t统计量

目的

在线性回归t统计数据是有用的回归系数进行推断。系数的假设检验测试零假设,它等于零,这意味着相应的术语并不重要——和替代假设系数不同于零。

定义

在系数的假设测试,

H0:β= 0

H1:β≠0,

t统计数据是:

t = b 年代 E ( b ) ,

在哪里SE(b)估计的标准误差系数b

如何

在获得拟合模型,mdl,使用fitlmstepwiselm,您可以:

  • 找到的系数估计,估计的标准误差(SE),t统计假设测试的值相应的系数(tStat)在输出显示。

  • 要求显示使用

    显示器(mdl)

评估使用t统计量回归系数的意义

这个例子展示了如何测试使用t统计量对回归系数的意义。

加载示例数据和线性回归模型。

负载哈尔德mdl = fitlm(成分、热)
mdl =线性回归模型:y ~ 1 + x1 + x2 + x3 + x4估计系数:估计SE tStat pValue ________ _________说x1(拦截)62.405 70.071 0.8906 0.39913 1.5511 0.74477 2.0827 0.070822 x2 0.51017 0.72379 0.70486 0.5009 x3 x4 -0.14406 0.70905 -0.20317 0.89592 0.10191 0.75471 0.13503 0.84407的观测数量:13日误差自由度:8根均方误差:2.45平方:0.982,调整平方:0.974 f统计量与常数模型:111年,假定值= 4.76 e-07

你可以看到,对于每个系数,tStat =估计/ SE。的 p 值的假设测试pValue列。每一个 t 统计测试每个术语的重要性给定模型中的其他条款。根据这些结果,似乎没有一个系数显著在5%的显著性水平,虽然模型是很高的平方值为0.97。这通常表明可能的预测变量之间的多重共线性。

用逐步回归来决定哪些变量包括在模型中。

负载哈尔德mdl = stepwiselm(成分、热)
1。添加x4, FStat = 22.7985, pValue = 0.000576232 - 2。添加x1, FStat = 108.2239, pValue = 1.105281 e-06
mdl =线性回归模型:y ~ 1 + x1 + x4估计系数:估计SE tStat pValue说____ __________(拦截)103.1 2.124 48.54 3.3243 e-13 x1 e-06 x4 1.1053 1.44 0.13842 10.403 -0.61395 0.048645 -12.621 1.8149 e-07数量的观察:13日误差自由度:10根均方误差:2.73平方:0.972,调整平方:0.967 f统计量与常数模型:177年,假定值= 1.58 e-08

在这个例子中,stepwiselm始于常数模型(默认),并使用向前选择逐步添加x4x1。最终模型中的每个预测变量是重要的另一个是在模型中。算法停止当添加其他预测变量在模型中显著提高。逐步回归的细节,请参阅stepwiselm

另请参阅

|||||

相关的话题