。
カスタム基準を使用した逐次特徴選択
Inmodel = sequentialfs(乐趣,x,y)
Inmodel = sequentialfs(有趣,x,y,z,...)
[inmodel、历史]= sequentialfs(有趣,X,…)
[] =顺序(...,param1
那Val1.
那param2
那val2.
,......)
Inmodel = sequentialfs(乐趣,x,y)
は,データ行列X
y
のデータを最大无限予测し。X
の行は観测値対応し,列は函数または特徴量対応しししし。y
はX
の各観测観测値に対するに対する値の列ベクトルベクトルまたはクラスラベルX
とy
の行数はでなけれでなければなりません。有趣的
は,特价の选択と时期のの决定使使される规准をする关键词关键inmodel
は最終的に選択された特徴量を示す逻辑ベクトルです。
序列
は,空の特价セットから开放して,まだ选択されてい特徴を1つずつ连続的に追し候补特徴サブセットををし特徴のサブセットのそれぞれについて。序列
は有趣的
を繰り返し呼び出し10分割交差検証を実行します。この呼び出しでは,X
とy
の异なる学习サブセット(XTrain.
とytrain.
),およびX
とy
の検定サブセット(XTest.
とytest.
)を次のように使使。
标准=乐趣(XTRAIN、ytrain XTEST、欧美)
XTrain.
とytrain.
にはX
とy
の行の同じサブセットが含まれ,XTest.
とytest.
には行の相补サブがが含まれます。XTrain.
とXTest.
には,现处于の候补特性セットに対応するX
の列から受け取ったデータが含まれます。
有趣的
は呼び出されるごと,スカラー値标准
をを必ず返し。通讯,有趣的
ではXTrain.
とytrain.
を使用してモデルの习またはまたはを行,そのモデルを使使してXTest.
の値を予测し,ytest.
からからのそれらのの予测値の何らかの距离の尺度,つまり"損失"を返します。与えられた候补特徴セット交差検证検证では,序列
は有趣的
からの戻り値を総和し,それをテスト観測総数で割ります。そしてこの平均値を使用して,候補特徴サブセットのそれぞれを評価します。
一般的な损失测定値は,回帰モデルの二乘误差和(このこの合,序列
は平均二乘误差を计算计算计算れモデルのの计算された観测分数(序列
は誤分類率を計算)が含まれます。
メモ
序列
は有趣的
したがって,テストの観测総和を割りてて値値ます。有趣的
ははその力値テストのの観测観测で割るはありません。
候補特徴サブセットのそれぞれについて平均の标准
値を计算した后,序列
は平均规准値最最するサブサブは,特はは规准値ますもそれそれ规准値が减少なくそれ规准値规准値减少しなるまで続けられますなくなる続け続けます减少なるなる続けまで続けられられ最なるまで続けられられ
Inmodel = sequentialfs(有趣,x,y,z,...)
は,X
那y
那Z.
,......など,入力次数のに制序列
はX
那y
那Z.
などに特別の解釈をせず,X
の列にある特だけを选択します。列列ベクトルのもものの场も,すべてのデータデータ力は行为でなければません。序列
は,X
那y
那Z.
,......の学习サブセットとテストを使使使てての次に有趣的
を呼び出します。
Criterion = Fun(XTrain,Ytrain,Ztrain,...,XTest,YTEST,ZTEST,......)
序列
は,XTrain.
那YTRAIN
那ZTRAIN
,......,XTest.
那ytest.
那ZTEST.
などを作物成します,そのそのにX
那y
那Z.
などの行のサブセットを选択します有趣的
はスカラー値标准
を返さなければなりませんが,その値の计算はどのようで行ってかまいんんんんんん.Logicalベクトルinmodel
の要素はX
の列に対応し,最终的に选択された特价を示します。
[inmodel、历史]= sequentialfs(有趣,X,…)
は,各ステップにおいて选択さた特种に关键词历史
はスカラー構造体で,次のフィールドがあります。
暴击
——各ステップにおいて計算される規準値を含むベクトル。
在
- ステップ一世
で选択されたた特徴,行一世
にもつ逻辑行为。
[] =顺序(...,
は,次の表に示すパラメーターパラメーターののと値をを指定します。param1
那Val1.
那param2
那val2.
,......)
パラメーター | 値 |
---|---|
'简历' |
时尚サブセットの各候补をを
既定値は いわゆる“ラッパー法”では,学習アルゴリズムを実装する関数 |
'mcreps' |
交差検証用のモンテカルロ反復回数を示す正の整数。既定値は |
“方向” |
连続探索の方向。既定の设定は |
'keepin' |
逻辑ベクトル,または列番のの。 |
“禁入” |
户外されなければならない特价をする逻辑ベクトル,または列番番の。 |
'nfeatures' |
|
“nullmodel” |
ヌルモデル( |
“选项” |
并列并列を行うに,并行计算工具箱™が必要です。 |
ノイズのある特徴量を分類するために逐次特徴選択を実行します。
可重复性X = randn(150,10);X(:,[1 3 5 7])= meas;y =物种;c = cvpartition (y,“k”,10);选择= statset(“显示”、“iter”);XT有趣= @ (XT,欧美,欧美)损失(fitcecoc (XT,欧美),XT,欧美);[fs,history] = sequentialfs(fun,X,y,'cv',c,'options',opts)步骤1,添加列5,则值0.00266667步骤2,添加列7,则价值0.00222222步骤3,添加列1,标准价值0.00177778步骤4,第三列,则价值0.000888889最后一列包括:1 3 5 7 fs = 1×10逻辑数组1 0 1 0 1 0 1 0 0 0 =历史结构体字段::[4×10逻辑]致命一击:[0.0027 0.0022 0.0018 8.8889e-04]历史。在ans = 4×10 logical array 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0 1 0 1 0 0 0