f统计量和t统计量
f统计量
目的
在线性回归,f统计量的检验统计量方差分析(方差分析)的方法来测试模型的意义或组件模型。
定义
f统计量的线性模型输出显示的统计测试模型的统计学意义。模型属性ModelFitVsNullModel
包含相同的数据。
的f统计量的值方差分析
显示让你评估条款的意义或组件的模型。
如何
适合一个回归模型(mdl
)通过使用fitlm
或stepwiselm
。然后,您可以:
找到
f统计量与常数模型
在输出中显示或使用disp (mdl)
通过输入显示的f统计量模型
mdl.ModelFitVsNullModel
使用显示的方差分析模型
方差分析(mdl“摘要”)
获取组件的f统计量的值,除了使用常数项
方差分析(mdl)
方差分析
的方法LinearModel
类。
评估使用f统计量的模型
这个例子展示了如何评估模型的适应和使用f统计量的回归系数的意义。
加载示例数据。
负载医院台=表(hospital.Age hospital.Weight、hospital.Smoker hospital.BloodPressure (: 1),…“VariableNames”,{“年龄”,“重量”,“抽烟”,“血压”});资源描述。年代moker = categorical(tbl.Smoker);
适合一个线性回归模型。
mdl = fitlm(资源描述,的血压~年龄*重量+吸烟者+重量^ 2》)
mdl =线性回归模型:血压~ 1 +吸烟者+年龄*重量+体重^ 2估计系数:估计SE tStat pValue __________ _____ ________ __________(拦截)168.02 27.694 6.067 2.7149 e-08年龄Smoker_true重量0.079569 0.39861 0.19962 0.84221 -0.69041 0.3435 -2.0099 0.047305 9.8027 1.0256 9.5584 1.5969 e15汽油年龄:体重0.00021796 ^ 2 0.0021877 0.0011037 1.9822 0.050375 0.0025258 0.086294 0.93142重量数量的观察:100年,错误自由度:94根均方误差:4.73平方:0.528,调整平方:0.503 f统计量与常数模型:21岁的假定值= 4.81 e-14
f统计量的线性适应与常数模型是21日的p4.81 e-14的价值。该模型在5%的显著性水平具有重要意义。的平方值为0.528时表示模型解释了在响应中约53%的变异性。可能有其他预测变量(解释),不包括在当前的模型。
您也可以通过编程方式访问模型的f统计量。
mdl.ModelFitVsNullModel
ans =结构体字段:函数:21.0120 Pvalue: 4.8099 e-14 NullModel:“常数”
显示拟合模型的方差分析表。
方差分析(mdl“摘要”)
ans =5×5表SumSq DF MeanSq F pValue ______ __交__________ 99 4461.2 45.062 4.8099 470.9 - 21.012 2354.5 - 5 e-14模型。线性e15汽油7.2417 754.42 - 33.663 2263.3 - 3。非线性91.248 94 22.411 2106.6 45.624 2.0358 0.1363残留
这显示分离模型转换为线性和非线性的变化。因为有两个非线性术语(体重^ 2
和之间的交互重量
和年龄
),非线性的自由度DF
列是2。有三个线性模型中(一个条款吸烟者
指标变量,重量
,年龄
)。中相应的统计量F
列测试线性和非线性项的重要性作为单独的组。
当有重复观察,残余项也分为两个部分;第一个错误是由于缺乏健康,其次是纯误差独立于模型,从复制获得观测。在这种情况下,f统计量是用于测试缺乏健康,也就是说,是否适合是足够的。但是,在这个例子中,没有重复的观察。
显示模型的方差分析表。
方差分析(mdl)
ans =6×5表__________ SumSq DF MeanSq F pValue ________ __ ________ ____年龄体重62.991 - 1 62.991 2.8107 0.096959 0.064104 2047.5 0.064104 0.0028604 0.95746吸烟者1 2047.5 91.363 1.5969 e15汽油年龄:重量0.16689 - 1 0.16689 0.0074466 0.93142重量2 ^ 88.057 - 1 88.057 3.9292 0.050375 2106.6 94 22.411错误
这显示分解模型的方差分析表。中相应的统计量F
列评估每一项的统计显著性。例如,野生的吸烟者
测试是否指示符变量的系数吸烟者
不同于零。即野生决定作为一个烟民有显著的影响血压
。每个模型的自由度术语对应的野生的分子的自由度。所有条款都一个自由度。对于分类变量,自由度是变量的数量指标。吸烟者
只有一个指标变量,所以它也有一个自由度。
t统计量
目的
在线性回归t统计数据是有用的回归系数进行推断。系数的假设检验我测试零假设,它等于零,这意味着相应的术语并不重要——和替代假设系数不同于零。
定义
在系数的假设测试我,
H0:β我= 0
H1:β我≠0,
的t统计数据是:
在哪里SE(b我)估计的标准误差系数b我。
如何
在获得拟合模型,mdl
,使用fitlm
或stepwiselm
,您可以:
找到的系数估计,估计的标准误差(
SE
),t统计假设测试的值相应的系数(tStat
)在输出显示。要求显示使用
显示器(mdl)
评估使用t统计量回归系数的意义
这个例子展示了如何测试使用t统计量对回归系数的意义。
加载示例数据和线性回归模型。
负载哈尔德mdl = fitlm(成分、热)
mdl =线性回归模型:y ~ 1 + x1 + x2 + x3 + x4估计系数:估计SE tStat pValue ________ _________说x1(拦截)62.405 70.071 0.8906 0.39913 1.5511 0.74477 2.0827 0.070822 x2 0.51017 0.72379 0.70486 0.5009 x3 x4 -0.14406 0.70905 -0.20317 0.89592 0.10191 0.75471 0.13503 0.84407的观测数量:13日误差自由度:8根均方误差:2.45平方:0.982,调整平方:0.974 f统计量与常数模型:111年,假定值= 4.76 e-07
你可以看到,对于每个系数,tStat =估计/ SE
。的
值的假设测试pValue
列。每一个
统计测试每个术语的重要性给定模型中的其他条款。根据这些结果,似乎没有一个系数显著在5%的显著性水平,虽然模型是很高的平方值为0.97。这通常表明可能的预测变量之间的多重共线性。
用逐步回归来决定哪些变量包括在模型中。
负载哈尔德mdl = stepwiselm(成分、热)
1。添加x4, FStat = 22.7985, pValue = 0.000576232 - 2。添加x1, FStat = 108.2239, pValue = 1.105281 e-06
mdl =线性回归模型:y ~ 1 + x1 + x4估计系数:估计SE tStat pValue说____ __________(拦截)103.1 2.124 48.54 3.3243 e-13 x1 e-06 x4 1.1053 1.44 0.13842 10.403 -0.61395 0.048645 -12.621 1.8149 e-07数量的观察:13日误差自由度:10根均方误差:2.73平方:0.972,调整平方:0.967 f统计量与常数模型:177年,假定值= 1.58 e-08
在这个例子中,stepwiselm
始于常数模型(默认),并使用向前选择逐步添加x4
和x1
。最终模型中的每个预测变量是重要的另一个是在模型中。算法停止当添加其他预测变量在模型中显著提高。逐步回归的细节,请参阅stepwiselm
。
另请参阅
LinearModel
|fitlm
|stepwiselm
|方差分析
|coefCI
|coefTest