主要内容

决定系数(r平方)

目的

决定系数(r平方)表示响应变量中变化的比例y由自变量解释X在线性回归模型中。r平方越大,线性回归模型解释的变异性越多。

定义

r平方是由模型解释的总平方和的比例。Rsquared,拟合模型的一个属性,是一个具有两个字段的结构:

  • 普通的-普通(未经调整)r平方

    R 2 年代 年代 R 年代 年代 T 1 年代 年代 E 年代 年代 T

  • 调整- r平方调整系数的数量

    R 一个 d j 2 1 n 1 n p 年代 年代 E 年代 年代 T

    上交所是误差平方和,苏维埃社会主义共和国是回归平方和,风场是总和的平方和,n是观察数,和p是回归系数的个数。请注意,p包括截距,例如,p线性拟合为2。因为r平方随着回归模型中预测变量的增加而增加,调整后的r平方会根据模型中预测变量的数量进行调整。这使得它在比较具有不同数量预测因子的模型时更有用。

如何

在得到一个合适的模型后,比如说,mdl,使用fitlmstepwiselm,您可以通过使用点表示法对属性进行索引来获得作为标量的r平方值,例如,

mdl.Rsquared.Ordinary mdl.Rsquared.Adjusted

也可以通过相同名称的属性获取SSE、SSR和SST。

mdl。上交所mdl。苏维埃社会主义共和国mdl。风场

显示决定系数

这个例子展示了如何显示r平方(决定系数)和调整后的r平方。加载样例数据并定义响应和自变量。

负载医院y = hospital.血压(:,1);X = double(医院(:,2:5));

拟合线性回归模型。

mdl = fitlm(X,y)
mdl =线性回归模型:y ~ 1 + x1 + x2 + x3 + x4估计系数:估计SE tStat pValue _________ ________ ________ __________(截距)117.4 5.2451 22.383 1.1667e-39 x1 0.88162 2.9473 0.29913 0.76549 x2 0.08602 0.06731 1.278 0.20438 x3 -0.016685 0.055714 -0.29947 0.76524 x4 9.884 1.0406 9.498 1.9546e-15观测数:100,误差自由度:95均方根误差:4.81 r平方:0.508,调整r平方:0.487 f统计量vs常数模型:24.5, p-value = 5.99e-14

r平方和调整后的r平方值分别为0.508和0.487。模型解释了响应变量中大约50%的可变性。

使用拟合的属性访问r平方和调整后的r平方值LinearModel对象。

mdl.Rsquared.Ordinary
Ans = 0.5078
mdl.Rsquared.Adjusted
Ans = 0.4871

调整后的r平方值小于普通r平方值。

另请参阅

|||

相关的话题