套索正助化
この例では,套索
で不要な予测子を识别して破弃する方法を示します。
さまざまな手段により,5次元の人为的なxの标本を偏分分布から200个生成します。
RNG(3,'twister'的)再现性的百分比x =零(200,5);为了II = 1:5 x(:,ii)= EXPRND(II,200,1);结尾
応答データy
=X
*R.
+EPS.
を生成します。R.
には非ゼロ成分が2つしかなく,ノイズEPS.
は标准偏差が0.1の正式分布に従います。
r = [0; 2; 0; -3; 0];Y = X * R + RANDN(200,1)*。1;
交差交差検证されれたモデルシーケンスシーケンス套索
であてはめ,结果结果プロットし。
[b,fitinfo] =套索(x,y,'简历'10);Lassoplot(B,FitInfo,'plottype'那'lambda'那'xscale'那'日志');
このプロットには,lambda.
正源化に対するlambda.
の大きな値はグラフの左侧に表示され,より正则化されると,非ゼロの回帰系数が少なくなることを意味します。
縦の点线は,最小平均二乘误差発生物したlambda.
値(右侧)と,最小平均二乘误差误差ににのの标准偏差加入ししlambda.
値値表します。このこの后者の値,lambda.
のの设定です。これらの线は交差検证実する场にに表示れますますますますます。名称と値のペアの幂'简历'
をを设定するいい交差をでいこのをでは,10分钟
プロットの上部に自由度(df)ががされ,回帰内の非ゼロののををを,lambda,lambda,lambda,lambda,lambda値値大声ため,1つを除くすべてののが0に右侧では,5つの系数はすべて非です,2つの系だけがプロットに他ののつの系れて非常にさいのでのでのでのでのでのでので的にににに的的に的的的的的的的的的的
lambdaの値が小さいさい合(プロットプロット右方向),系数の値は最小二乘の推定ににます。
最小交差検证平衡二乘误差に1标准偏差を加入たlambda.
値値を见つけますlambda.
で,あてはめのmseおよびおよびをます。
lam = fitinfo.index1se;fitinfo.mse(林)
ANS = 0.1398.
B(:,林)
ANS =.5×10 1.8855 0 -2.9367 0
套索
は,系数ベクトルR.
を适切に検出しました。
比较のため,R.
のの小二乘推定値をます。
rhat = x \ y
rhat =5×1-0.0038 1.9952 0.0014 -2.9993 0.0031
推定値B(:,林)
では罗阿
の平均二乘误差よりも平均二乘误差がわずかに大きくなります。
res = x * rhat - y;%计算残差msemin = res'* res / 200%b(:,am)值为0.1398
msemin = 0.0088
しかしB(:,林)
に含まれる非ゼロの成分は2つのみであるため,新しいデータでより适切な予测推定を提示できます。
参考
套索
|lassoglm.
|Fitrinear.
|Lassoplot.
|岭