什么是线性回归模型？- MATLAB＆S金宝appimulink的 - MathWorks公司澳大利亚

什么是线性回归模型？

线性回归模型描述了一种之间的关系因变量，ÿ，以及一个或多个独立变量，X。因变量也被称为响应变量。自变量也被称为解释性要么预测变量。连续预测变量也被称为协变量和分类预测变量也叫因素。矩阵X在预测变量的观察通常被称为设计矩阵。

多元线性回归模型是

$ÿ_{一世} = β_{0} + β_{1} X_{一世 1} + β_{2} X_{一世 2} + \dots + β_{p} X_{一世 p} + ε_{一世} ，一世 = 1 ， \dots ， ñ ，$

哪里

ÿ_一世是个一世个响应。
β_ķ是个ķ个系数，其中β₀在模型中的常数项。有时候，设计矩阵可能包括对常数项信息。然而，fitlm要么stepwiselm默认情况下，包括模型中的常数项，所以你不得进入1秒的一列到你的设计矩阵X。
X_IJ是个一世上个观察Ĵ个预测变量，Ĵ= 1，...，p。
ε_一世是个一世个噪声项，即，随机错误。

如果模型仅包括一个预测变量（p= 1），则模型被称为简单的线性回归模型。

一般情况下，线性回归模型可以是以下形式的模型

$ÿ_{一世} = β_{0} + Σ_{ķ = 1}^{ķ} β_{ķ} F_{ķ} （ X_{一世 1} ， X_{一世 2} ， \dots ， X_{一世 p} ） + ε_{一世} ，一世 = 1 ， \dots ， ñ ，$

哪里F（·）是自变量的标量值函数，X_IJ秒。其他功能方面，F（X），可能是任何形式的，包括非线性函数或多项式。线性，在线性回归模型，是指系数的线性β_ķ。也就是说，响应变量，ÿ是系数的线性函数，β_ķ。

线性模型的一些例子：

$\begin{array}{l} ÿ_{一世} = β_{0} + β_{1} X_{1 一世} + β_{2} X_{2 一世} + β_{3} X_{3 一世} + ε_{一世} \\ ÿ_{一世} = β_{0} + β_{1} X_{1 一世} + β_{2} X_{2 一世} + β_{3} X_{1 一世}^{3} + β_{4} X_{2 一世}^{2} + ε_{一世} \\ ÿ_{一世} = β_{0} + β_{1} X_{1 一世} + β_{2} X_{2 一世} + β_{3} X_{1 一世} X_{2 一世} + β_{4} 日志 X_{3 一世} + ε_{一世} \end{array}$

下面，不过，不是线性的模型，因为它们不是线性的未知系数，β_ķ。

$\begin{array}{l} 日志 ÿ_{一世} = β_{0} + β_{1} X_{1 一世} + β_{2} X_{2 一世} + ε_{一世} \\ ÿ_{一世} = β_{0} + β_{1} X_{1 一世} + \frac{1}{β_{2} X_{2 一世}} + Ë^{β_{3} X_{1 一世} X_{2 一世}} + ε_{一世} \end{array}$

线性回归模型通常假定是：

噪音方面，ε_一世，是不相关的。
噪音方面，ε_一世，具有零均值和常数方差，σ独立同正态分布²。从而，

$\begin{array}{l} Ë （ ÿ_{一世} ） = Ë （ Σ_{ķ = 0}^{ķ} β_{ķ} F_{ķ} （ X_{一世 1} ， X_{一世 2} ， \dots ， X_{一世 p} ） + ε_{一世} ） \\ = Σ_{ķ = 0}^{ķ} β_{ķ} F_{ķ} （ X_{一世 1} ， X_{一世 2} ， \dots ， X_{一世 p} ） + Ë （ ε_{一世} ） \\ = Σ_{ķ = 0}^{ķ} β_{ķ} F_{ķ} （ X_{一世 1} ， X_{一世 2} ， \dots ， X_{一世 p} ） \end{array}$

和

$V （ ÿ_{一世} ） = V （ Σ_{ķ = 0}^{ķ} β_{ķ} F_{ķ} （ X_{一世 1} ， X_{一世 2} ， \dots ， X_{一世 p} ） + ε_{一世} ） = V （ ε_{一世} ） = σ^{2}$

所以方差ÿ_一世是各级同X_IJ。
响应ÿ_一世是不相关的。

拟合线性函数是

${\hat{ÿ}}_{一世} = Σ_{ķ = 0}^{ķ} b_{ķ} F_{ķ} （ X_{一世 1} ， X_{一世 2} ， \dots ， X_{一世 p} ），一世 = 1 ， \dots ， ñ ，$

哪里 ${\hat{ÿ}}_{一世}$ 是所估计的响应和b_ķs为拟合系数。系数被估计，以便最小化所述预测矢量之间的均方差 $\hat{ÿ}$ 和真实响应向量 $ÿ$ ，那是 $\hat{ÿ} - ÿ$ 。这种方法被称为最小二乘法。下的噪声项的假设，这些系数也最大限度地提高预测矢量的可能性。

在以下形式的线性回归模型ÿ=β₁X₁+β₂X₂+ ... +β_pX_p时，系数β_ķ表示在预测变量的一单位的变化的影响，X_Ĵ，对响应E的平均值（ÿ），前提是所有其他变量保持不变。系数的符号给出了效果的方向。例如，如果线性模型是E（ÿ）= 1.8 - 2.35X₁+X₂，然后-2.35表示在具有增加一个单位的平均响应一个2.35单位减少X₁鉴于X₂保持不变。如果模型E（ÿ）= 1.1 + 1.5X₁²+X₂，系数X₁²表示在均值的1.5单位增加ÿ与增加一个单位在X₁²给予一切保持不变。然而，在E的情况下（ÿ）= 1.1 + 2.1X₁+ 1.5X₁²，就很难解释同样的系数，因为它是不可能保持X₁当不变X₁²变化，或反之亦然。

参考

[1] Neter的，J.，M. H.库特纳，C.J。纳赫茨海姆，和W.沃瑟曼。应用线性统计模型。欧文麦格劳 - 希尔集团有限公司，1996年。

[2] Seber，G. A. F.线性回归分析。威利系列在概率论与数理统计。John Wiley和Sons公司，1977年。

也可以看看

线性模型|fitlm|stepwiselm

什么是线性回归模型？

参考

也可以看看

相关话题

统计和机器学习工具箱文档

金宝app

掌握机器学习：有步骤，分步指南与MATLAB