拉索和弹性网- MATLAB和Simulink金宝app - 金宝app,下载188bet金宝搏,金宝搏官方网站

套索和弹性网

Lasso是一种正则化技术。使用套索:

弹性网是一种相关的技术。当你有几个高度相关的变量时，使用弹性网络。套索设置时提供弹性网络正则化α名称-值对与严格介于两者之间的数字0和1。

有关回归系综的套索正则化，请参阅规范。

Lasso是一种用于执行线性回归的正则化技术。Lasso包含一个约束估计系数大小的惩罚项。因此,它就像岭回归。拉索是一个收缩估计:它产生的系数估计值偏小。然而，lasso估计器在应用于新数据时，其平均平方误差可能比普通最小二乘估计器小。

与脊回归不同，随着惩罚项的增加，lasso将更多的系数设置为零。这意味着lasso估计器是一个更小的模型，具有更少的预测器。因此，lasso是另一种选择逐步回归以及其他模型选择和降维技术。

弹性网是一种相关的技术。弹性网是脊线回归和套索正则化的混合。与lasso类似，elastic net可以通过生成零值系数来生成简化模型。经验研究表明，在具有高度相关预测因子的数据上，弹性网络技术可以超越lasso。

的套索技术解决了这个正则化问题。对于给定的值λ，非负参数，套索解决问题

$\underset{β_{0}, β}{最小值} (\frac{1}{2 N} \sum_{我 = 1}^{N} {(y_{我} - β_{0} - x_{我}^{T} β)}^{2} + λ \sum_{j = 1}^{p} | β_{j} |) 。$

作为λ的非零分量的数目β减少。

套索问题涉及到l¹规范的β，与弹性网格算法进行对比。

的弹力网技术解决了这个正则化问题。对于一个α严格0和1，以及一个非负之间λ，弹力网解决问题

$\underset{β_{0}, β}{最小值} (\frac{1}{2 N} \sum_{我 = 1}^{N} {(y_{我} - β_{0} - x_{我}^{T} β)}^{2} + λ P_{α} (β)),$

在哪里

$P_{α} (β) = \frac{(1 - α)}{2} {为 β 为}_{2}^{2} + α {为 β 为}_{1} = \sum_{j = 1}^{p} (\frac{(1 - α)}{2} β_{j}^{2} + α | β_{j} |) 。$

弹性网与套索时是一样的α= 1。作为α向0收缩，弹性网接近脊回归。对于其他值α，惩罚项P_α(β)之间插入l¹规范的β和方l²规范的β。

[1]Tibshirani, R。回归收缩和选择通过套索。《皇家统计学会期刊》，B辑，第58卷，第1期，第267-288页，1996年。

[2]邹，H.和T.哈斯蒂。正则化，并通过弹性网络变量选择。《皇家统计学会期刊》，B辑，第67卷，第2期，第301-320页，2005年。

[3]弗里德曼，J.， R. Tibshirani和T. Hastie。广义线性模型的坐标下降正则化路径。统计软件杂志，第33卷，第1期，2010年。https://www.jstatsoft.org/v33/i01

[4] Hastie, T.， R. Tibshirani和J. Friedman。统计学习的要素，第二版。施普林格，纽约，2008年。