线性回归模型描述了因变量,Y,以及一个或多个自变量,X。因变量也称为响应变量.自变量也被称为解释性的或预测变量.连续预测变量也称为协变量和分类预测变量也被称为因素.矩阵X对预测变量的观测结果通常称为设计矩阵。
建立了多元线性回归模型
哪里
Y我是我第四个答复。
βK是Kth系数,其中β0是模型中的常数项。有时,设计矩阵可能包含有关常数项的信息。然而菲特姆
或逐步地
默认情况下,模型中包含一个常数项,所以你不能在你的设计矩阵中输入一列1X。
Xij是我第四次对Jth预测变量,J= 1, ...,P。
ε我是我噪声项,即随机误差。
如果模型仅包含一个预测变量(P= 1)然后将该模型称为简单线性回归模型。
一般来说,线性回归模型可以是一种形式的模型
哪里F(.)是自变量的标量值函数,Xijs功能,,F(X),可以是任何形式的,包括非线性函数或多项式。线性回归模型中的线性是指系数的线性βK. 即响应变量,Y,是系数的线性函数,βK。
线性模型的一些示例包括:
然而,以下不是线性模型,因为它们在未知系数中不是线性的,βK。
线性回归模型的通常假设为:
噪音术语,ε我,是不相关的。
噪音术语,ε我,具有独立且相同的正态分布,均方差为零且为常数,σ2.因此
和
那么Y我对于所有级别的Xij。
回应Y我它们是不相关的。
拟合的线性函数为
哪里 是估计的响应和BKs是拟合系数。估计系数以最小化预测向量之间的均方差 和真实响应向量 就是 。此方法称为最小二乘法。在噪声项的假设下,这些系数也使预测向量的可能性最大化。
在线性回归模型的形式Y=β1.X1.+β2.X2.+ ... +βPXP,系数βK表示预测变量中一个单位变化的影响,XJ,关于响应E的平均值(Y),前提是所有其他变量保持不变。系数的符号表示效果的方向。例如,如果线性模型为E(Y) = 1.8 – 2.35X1.+X2.,则–2.35表示平均响应减少2.35个单位,平均响应增加1个单位X1.鉴于X2.保持不变。如果模型为E(Y) = 1.1 + 1.5X1.2.+X2.的系数X1.2.表示平均值增加1.5个单位Y增加了一个单位X1.2.如果其他条件不变。然而,在E(Y) = 1.1 + 2.1X1.+ 1.5X1.2.,很难对系数进行类似的解释,因为不可能保持不变X1.恒定时X1.2.改变,反之亦然。
[1] 内特,J.,M.H.库特纳,C.J.纳希特谢姆和W.瓦瑟曼。应用线性统计模型欧文,麦格劳-希尔公司,1996年。
[2] 塞伯,G.A.F。线性回归分析。概率与数理统计中的威利级数。约翰·威利父子公司,1977。