什么是线性回归模型MATLAB与Simulink金宝app - 金宝app,下载188bet金宝搏,金宝搏官方网站

什么是线性回归模型？

线性回归模型描述了因变量,Y，以及一个或多个自变量,X。因变量也称为响应变量.自变量也被称为解释性的或预测变量.连续预测变量也称为协变量和分类预测变量也被称为因素.矩阵X对预测变量的观测结果通常称为设计矩阵。

建立了多元线性回归模型

$Y_{我} = β_{0} + β_{1.} X_{我 1.} + β_{2.} X_{我 2.} + \dots + β_{P} X_{我 P} + ε_{我}, 我 = 1., \dots, N,$

哪里

Y_我是我第四个答复。
β_K是Kth系数，其中β₀是模型中的常数项。有时，设计矩阵可能包含有关常数项的信息。然而菲特姆或逐步地默认情况下，模型中包含一个常数项，所以你不能在你的设计矩阵中输入一列1X。
X_ij是我第四次对Jth预测变量，J= 1, ...,P。
ε_我是我噪声项，即随机误差。

如果模型仅包含一个预测变量(P= 1)然后将该模型称为简单线性回归模型。

一般来说，线性回归模型可以是一种形式的模型

$Y_{我} = β_{0} + \sum_{K = 1.}^{K} β_{K} F_{K} (X_{我 1.}, X_{我 2.}, \dots, X_{我 P}) + ε_{我}, 我 = 1., \dots, N,$

哪里F(.)是自变量的标量值函数，X_ijs功能,，F(X)，可以是任何形式的，包括非线性函数或多项式。线性回归模型中的线性是指系数的线性β_K. 即响应变量，Y，是系数的线性函数，β_K。

线性模型的一些示例包括：

$\begin{array}{l} Y_{我} = β_{0} + β_{1.} X_{1. 我} + β_{2.} X_{2. 我} + β_{3.} X_{3. 我} + ε_{我} \\ Y_{我} = β_{0} + β_{1.} X_{1. 我} + β_{2.} X_{2. 我} + β_{3.} X_{1. 我}^{3.} + β_{4.} X_{2. 我}^{2.} + ε_{我} \\ Y_{我} = β_{0} + β_{1.} X_{1. 我} + β_{2.} X_{2. 我} + β_{3.} X_{1. 我} X_{2. 我} + β_{4.} 日志 X_{3. 我} + ε_{我} \end{array}$

然而，以下不是线性模型，因为它们在未知系数中不是线性的，β_K。

$\begin{array}{l} 日志 Y_{我} = β_{0} + β_{1.} X_{1. 我} + β_{2.} X_{2. 我} + ε_{我} \\ Y_{我} = β_{0} + β_{1.} X_{1. 我} + \frac{1.}{β_{2.} X_{2. 我}} + E^{β_{3.} X_{1. 我} X_{2. 我}} + ε_{我} \end{array}$

线性回归模型的通常假设为：

噪音术语，ε_我，是不相关的。
噪音术语，ε_我，具有独立且相同的正态分布，均方差为零且为常数，σ^2.因此

$\begin{array}{l} E (Y_{我}) = E (\sum_{K = 0}^{K} β_{K} F_{K} (X_{我 1.}, X_{我 2.}, \dots, X_{我 P}) + ε_{我}) \\ = \sum_{K = 0}^{K} β_{K} F_{K} (X_{我 1.}, X_{我 2.}, \dots, X_{我 P}) + E (ε_{我}) \\ = \sum_{K = 0}^{K} β_{K} F_{K} (X_{我 1.}, X_{我 2.}, \dots, X_{我 P}) \end{array}$

和

$v (Y_{我}) = v (\sum_{K = 0}^{K} β_{K} F_{K} (X_{我 1.}, X_{我 2.}, \dots, X_{我 P}) + ε_{我}) = v (ε_{我}) = σ^{2.}$

那么Y_我对于所有级别的X_ij。
回应Y_我它们是不相关的。

拟合的线性函数为

${\hat{Y}}_{我} = \sum_{K = 0}^{K} B_{K} F_{K} (X_{我 1.}, X_{我 2.}, \dots, X_{我 P}), 我 = 1., \dots, N,$

哪里 ${\hat{Y}}_{我}$ 是估计的响应和B_Ks是拟合系数。估计系数以最小化预测向量之间的均方差 $\hat{Y}$ 和真实响应向量 $Y$ 就是 $\hat{Y} - Y$ 。此方法称为最小二乘法。在噪声项的假设下，这些系数也使预测向量的可能性最大化。

在线性回归模型的形式Y=β_1.X_1.+β_2.X_2.+ ... +β_PX_P，系数β_K表示预测变量中一个单位变化的影响，X_J，关于响应E的平均值(Y)，前提是所有其他变量保持不变。系数的符号表示效果的方向。例如，如果线性模型为E(Y) = 1.8 – 2.35X_1.+X_2.，则–2.35表示平均响应减少2.35个单位，平均响应增加1个单位X_1.鉴于X_2.保持不变。如果模型为E(Y) = 1.1 + 1.5X_1.^2.+X_2.的系数X_1.^2.表示平均值增加1.5个单位Y增加了一个单位X_1.^2.如果其他条件不变。然而，在E(Y) = 1.1 + 2.1X_1.+ 1.5X_1.^2.，很难对系数进行类似的解释，因为不可能保持不变X_1.恒定时X_1.^2.改变，反之亦然。

参考文献

[1] 内特，J.，M.H.库特纳，C.J.纳希特谢姆和W.瓦瑟曼。应用线性统计模型欧文，麦格劳-希尔公司，1996年。

[2] 塞伯，G.A.F。线性回归分析。概率与数理统计中的威利级数。约翰·威利父子公司，1977。

另见

线性模型|菲特姆|逐步地

什么是线性回归模型？

参考文献

另见

相关的话题

统计和机器学习工具箱文档

金宝app

掌握机器学习：用MATLAB逐步指导