偏差是残差平方和的推广。它衡量的是与饱和模型相比的拟合优度。
模型的偏差米1是模型对数似然差的两倍吗米1饱和模型米年代.饱和模型是指具有最大数量的参数的模型。
例如,如果你有n观察(y我,我= 1, 2,…n),其值可能不同X我Tβ,则可以定义一个饱和模型n参数。让l(b,y)表示带有参数的模型的似然函数的最大值b.然后是模型的偏差米1是
在哪里b1和b年代包含模型的估计参数米1和饱和模型。偏差有卡方分布n- - - - - -p自由度,其中n饱和模型中的参数数和p模型中的参数个数是多少米1.
假设你有两个不同的广义线性回归模型米1和米2,米1有这些项的子集吗米2.你可以通过比较偏差来评估模型的适合度D1和D2这两种型号的。偏差的区别是
渐近,D有自由度的卡方分布吗v等于中估计的参数数之差米1和米2.你可以获得p为这个测试使用1 - chi2cdf (D, v)
.
通常,您检查D使用一个模型米2一个常数项,没有预测因子。因此,D有卡方分布吗p- 1的自由度。如果估计了色散,那么差除以估计色散有F分布与p- 1分子的自由度n- - - - - -p分母自由度。