线性回归模型是什么?意大利- MATLAB金宝app和Simulink MathWorks - 金宝app,下载188bet金宝搏,金宝搏官方网站

线性回归模型是什么?

一个线性回归模型描述之间的关系因变量,y和一个或多个独立变量,X。也称为因变量反应变量。也称为独立变量说明或预测变量。也称为连续预测变量协变量,也称为分类预测变量因素。矩阵X通常被称为观测的预测变量设计矩阵。

多元线性回归模型

$y_{我} = β_{0} + β_{1} X_{我 1} + β_{2} X_{我 2} + \dots + β_{p} X_{我 p} + ε_{我}, 我 = 1, \dots, n,$

在哪里

y_我是我响应。
β_k是kth系数,β₀模型中的常数项。有时候,设计矩阵可能包括常数项的信息。然而,fitlm或stepwiselm默认情况下包括模型中的常数项,所以你不能进入1 s到你的设计矩阵的一列X。
X_ij是我th的观察j预测变量,j= 1,…,p。
ε_我是我th噪声项,即随机误差。

如果一个模型只包含一个预测变量(p= 1),那么模型称为简单线性回归模型。

一般来说,线性回归模型可以是一个模型的形式

$y_{我} = β_{0} + \sum_{k = 1}^{K} β_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}) + ε_{我}, 我 = 1, \dots, n,$

在哪里f()是一个纯量值独立变量的函数,X_ij年代。功能,f(X),可能以任何形式包括非线性函数和多项式。线性,在线性回归模型中,指的是线性的系数β_k。也就是说,响应变量,y,是一个线性函数的系数,β_k。

线性模型的例子有:

$\begin{array}{l} y_{我} = β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + β_{3} X_{3 我} + ε_{我} \\ y_{我} = β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + β_{3} X_{1 我}^{3} + β_{4} X_{2 我}^{2} + ε_{我} \\ y_{我} = β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + β_{3} X_{1 我} X_{2 我} + β_{4} 日志 X_{3 我} + ε_{我} \end{array}$

然而,下面不是线性模型,因为他们不是线性的未知系数,β_k。

$\begin{array}{l} 日志 y_{我} = β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + ε_{我} \\ y_{我} = β_{0} + β_{1} X_{1 我} + \frac{1}{β_{2} X_{2 我}} + e^{β_{3} X_{1 我} X_{2 我}} + ε_{我} \end{array}$

通常的线性回归模型的假设是:

噪音方面,ε_我是不相关的。
噪音方面,ε_我有独立且相同的正态分布均值为零,方差不变,σ²。因此,

$\begin{array}{l} E (y_{我}) = E (\sum_{k = 0}^{K} β_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}) + ε_{我}) \\ = \sum_{k = 0}^{K} β_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}) + E (ε_{我}) \\ = \sum_{k = 0}^{K} β_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}) \end{array}$

和

$V (y_{我}) = V (\sum_{k = 0}^{K} β_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}) + ε_{我}) = V (ε_{我}) = σ^{2}$

所以的方差y_我是相同的所有级别的X_ij。
的响应y_我是不相关的。

拟合的线性函数

${\hat{y}}_{我} = \sum_{k = 0}^{K} b_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}), 我 = 1, \dots, n,$

在哪里 ${\hat{y}}_{我}$ 估计响应和吗b_k年代的拟合系数。系数估计,以最小化均方预测向量之间的区别 $\hat{y}$ 和真正的响应向量 $y$ ,这是 $\hat{y} - y$ 。调用此方法最小二乘法。假设噪声条件下,这些系数也最大限度的可能性的预测向量。

在线性回归模型的形式y=β₁X₁+β₂X₂+……+β_pX_p,系数β_k表示一个单位预测变量的变化的影响,X_j在响应的均值E (y),提供所有其他变量保持不变。系数的符号给出了方向的影响。例如,如果线性模型是E (y)= 1.8 - 2.35X₁+X₂,然后-2.35意味着降低2.35单元平均响应增加1个单位X₁,鉴于X₂是保持不变的。如果模型是E (y)= 1.1 + 1.5X₁²+X₂的系数X₁²表明增加1.5单元的平均值Y增加1个单位X₁²其他条件保持不变。然而,在E (y)= 1.1 + 2.1X₁+ 1.5X₁²,很难解释系数类似的,因为它是不可能的X₁常数时X₁²的变化,反之亦然。

引用

[1]净,J。,M. H. Kutner, C. J. Nachtsheim, and W. Wasserman.应用线性统计模型。欧文,麦格劳-希尔公司,有限公司,1996年版。

[2]seb, g·a·F。线性回归分析。威利系列在概率论与数理统计。约翰•威利父子公司,1977年版。

另请参阅

LinearModel|fitlm|stepwiselm

线性回归模型是什么?

引用

另请参阅

相关的话题