决定系数(r平方)
目的
决定系数(r平方)表示响应变量中变化的比例y由自变量解释X在线性回归模型中。r平方越大,线性回归模型解释的变异性越多。
定义
r平方是由模型解释的总平方和的比例。Rsquared
,拟合模型的一个属性,是一个具有两个字段的结构:
普通的
-普通(未经调整)r平方调整
- r平方调整系数的数量上交所是误差平方和,苏维埃社会主义共和国是回归平方和,风场是总和的平方和,n是观察数,和p是回归系数的个数。请注意,p包括截距,例如,p线性拟合为2。因为r平方随着回归模型中预测变量的增加而增加,调整后的r平方会根据模型中预测变量的数量进行调整。这使得它在比较具有不同数量预测因子的模型时更有用。
如何
在得到一个合适的模型后,比如说,mdl
,使用fitlm
或stepwiselm
,您可以通过使用点表示法对属性进行索引来获得作为标量的r平方值,例如,
mdl.Rsquared.Ordinary mdl.Rsquared.Adjusted
也可以通过相同名称的属性获取SSE、SSR和SST。
mdl。上交所mdl。苏维埃社会主义共和国mdl。风场
显示决定系数
这个例子展示了如何显示r平方(决定系数)和调整后的r平方。加载样例数据并定义响应和自变量。
负载医院y = hospital.血压(:,1);X = double(医院(:,2:5));
拟合线性回归模型。
mdl = fitlm(X,y)
mdl =线性回归模型:y ~ 1 + x1 + x2 + x3 + x4估计系数:估计SE tStat pValue _________ ________ ________ __________(截距)117.4 5.2451 22.383 1.1667e-39 x1 0.88162 2.9473 0.29913 0.76549 x2 0.08602 0.06731 1.278 0.20438 x3 -0.016685 0.055714 -0.29947 0.76524 x4 9.884 1.0406 9.498 1.9546e-15观测数:100,误差自由度:95均方根误差:4.81 r平方:0.508,调整r平方:0.487 f统计量vs常数模型:24.5, p-value = 5.99e-14
r平方和调整后的r平方值分别为0.508和0.487。模型解释了响应变量中大约50%的可变性。
使用拟合的属性访问r平方和调整后的r平方值LinearModel
对象。
mdl.Rsquared.Ordinary
Ans = 0.5078
mdl.Rsquared.Adjusted
Ans = 0.4871
调整后的r平方值小于普通r平方值。
另请参阅
LinearModel
|fitlm
|stepwiselm
|方差分析