主要内容

。

序列

カスタム基準を使用した逐次特徴選択

构文

Inmodel = sequentialfs(乐趣,x,y)
Inmodel = sequentialfs(有趣,x,y,z,...)
[inmodel、历史]= sequentialfs(有趣,X,…)
[] =顺序(...,param1Val1.param2val2.,......)

说明

Inmodel = sequentialfs(乐趣,x,y)は,データ行列Xyのデータを最大无限予测し。Xの行は観测値対応し,列は函数または特徴量対応しししし。yXの各観测観测値に対するに対する値の列ベクトルベクトルまたはクラスラベルXyの行数はでなけれでなければなりません。有趣的は,特价の选択と时期のの决定使使される规准をする关键词关键inmodelは最終的に選択された特徴量を示す逻辑ベクトルです。

序列は,空の特价セットから开放して,まだ选択されてい特徴を1つずつ连続的に追し候补特徴サブセットををし特徴のサブセットのそれぞれについて。序列有趣的を繰り返し呼び出し10分割交差検証を実行します。この呼び出しでは,Xyの异なる学习サブセット(XTrain.ytrain.),およびXyの検定サブセット(XTest.ytest.)を次のように使使。

标准=乐趣(XTRAIN、ytrain XTEST、欧美)

XTrain.ytrain.にはXyの行の同じサブセットが含まれ,XTest.ytest.には行の相补サブがが含まれます。XTrain.XTest.には,现处于の候补特性セットに対応するXの列から受け取ったデータが含まれます。

有趣的は呼び出されるごと,スカラー値标准をを必ず返し。通讯,有趣的ではXTrain.ytrain.を使用してモデルの习またはまたはを行,そのモデルを使使してXTest.の値を予测し,ytest.からからのそれらのの予测値の何らかの距离の尺度,つまり"損失"を返します。与えられた候补特徴セット交差検证検证では,序列有趣的からの戻り値を総和し,それをテスト観測総数で割ります。そしてこの平均値を使用して,候補特徴サブセットのそれぞれを評価します。

一般的な损失测定値は,回帰モデルの二乘误差和(このこの合,序列は平均二乘误差を计算计算计算れモデルのの计算された観测分数(序列は誤分類率を計算)が含まれます。

メモ

序列有趣的したがって,テストの観测総和を割りてて値値ます。有趣的ははその力値テストのの観测観测で割るはありません。

候補特徴サブセットのそれぞれについて平均の标准値を计算した后,序列は平均规准値最最するサブサブは,特はは规准値ますもそれそれ规准値が减少なくそれ规准値规准値减少しなるまで続けられますなくなる続け続けます减少なるなる続けまで続けられられ最なるまで続けられられ

Inmodel = sequentialfs(有趣,x,y,z,...)は,XyZ.,......など,入力次数のに制序列XyZ.などに特別の解釈をせず,Xの列にある特だけを选択します。列列ベクトルのもものの场も,すべてのデータデータ力は行为でなければません。序列は,XyZ.,......の学习サブセットとテストを使使使てての次に有趣的を呼び出します。

Criterion = Fun(XTrain,Ytrain,Ztrain,...,XTest,YTEST,ZTEST,......)

序列は,XTrain.YTRAINZTRAIN,......,XTest.ytest.ZTEST.などを作物成します,そのそのにXyZ.などの行のサブセットを选択します有趣的はスカラー値标准を返さなければなりませんが,その値の计算はどのようで行ってかまいんんんんんん.Logicalベクトルinmodelの要素はXの列に対応し,最终的に选択された特价を示します。

[inmodel、历史]= sequentialfs(有趣,X,…)は,各ステップにおいて选択さた特种に关键词历史はスカラー構造体で,次のフィールドがあります。

  • 暴击——各ステップにおいて計算される規準値を含むベクトル。

  • - ステップ一世で选択されたた特徴,行一世にもつ逻辑行为。

[] =顺序(...,param1Val1.param2val2.,......)は,次の表に示すパラメーターパラメーターののと値をを指定します。

パラメーター
'简历'

时尚サブセットの各候补をを

  • この値が正の整数K.の場合,序列は層別化をしないK.分享交差検证を使使。

  • この値がCVPartition.クラスクラスオブジェクトの合书,他の形式の交差検证指定できます。

  • この値が“resubstitution”のの合,元元のデータはは习,検定検定データの区别なしなし有趣的に渡さに渡さ,规准を计算し。

  • この値が'没有任何'の場合,序列ははセットと学习セットを分类せずに,标准=乐趣(x,y,z,...)という形式で有趣的を呼び出します。

既定値は10.で,层别化をない10分钟交差検证になり。

いわゆる“ラッパー法”では,学習アルゴリズムを実装する関数有趣的を使用します。通常これらのメソッドは,交差検証を適用して特徴量を選択します。いわゆる“フィルター法”では,データの特性(相关性など)を评価して特性をする关键有趣的を使用します。

'mcreps'

交差検証用のモンテカルロ反復回数を示す正の整数。既定値は1です。'简历'値が“resubstitution”または'没有任何'の结合,この値は1でなければなりません。

“方向”

连続探索の方向。既定の设定は'向前'です。値'落后'は初期の候补集合を指定します。この集合は,すべての特徴量と,规准値が増加しなくなるまで连続的に特徴量を削除するアルゴリズムとを含みます。

'keepin'

逻辑ベクトル,または列番のの。

“禁入”

户外されなければならない特价をする逻辑ベクトル,または列番番の。

'nfeatures'

序列が停止条件とするする特性数量数。inmodelには空でますは空で。序列,“选项”'maxiter''tolfun'の値がオーバーライドされます。

“nullmodel”

ヌルモデル(Xからの特徴量を含まないモデル)を特徴の選択と历史出力に含めるかどうを示す示す论値既定の设定错误的です。

“选项”

实例化が作成した,反復連続探索アルゴリズムのオプション構造体。

序列は,以下の实例化ののを使使し。

  • 展示- アルゴリズムで表示される报ic。既定の设定は'离开'です。

  • 麦克斯特- 许容される最大反复数。既定既定の设定はです。

  • 塔尔芬- 目的关节数値终了许容许容误差。既定の设定は,“方向”'向前'の结合は1E-6“方向”'落后'の结合は0.です。

  • toltypefun- 目的关键词许容として绝対値相対値いずれ设定をしし。'rel'です。

  • 使用指α.- 并列并列计算する合真正的に设定します。既既定値错误的です。

  • Userumstreams.- 再生成可な方法でで计算计算场合真正的に设定します。既既定値错误的です。再现再现性のあるある计算をうに,をサブストリームを許可する型,'mlfg6331_64'または'MRG32K3A'に设定します。

  • -randstream.オブジェクトまたはそのようなオブジェクトで構成される细胞配列。を指定しないと,序列には既定のストリームが使用されます。

并列并列を行うに,并行计算工具箱™が必要です。

ノイズのある特徴量を分類するために逐次特徴選択を実行します。

可重复性X = randn(150,10);X(:,[1 3 5 7])= meas;y =物种;c = cvpartition (y,“k”,10);选择= statset(“显示”、“iter”);XT有趣= @ (XT,欧美,欧美)损失(fitcecoc (XT,欧美),XT,欧美);[fs,history] = sequentialfs(fun,X,y,'cv',c,'options',opts)步骤1,添加列5,则值0.00266667步骤2,添加列7,则价值0.00222222步骤3,添加列1,标准价值0.00177778步骤4,第三列,则价值0.000888889最后一列包括:1 3 5 7 fs = 1×10逻辑数组1 0 1 0 1 0 1 0 0 0 =历史结构体字段::[4×10逻辑]致命一击:[0.0027 0.0022 0.0018 8.8889e-04]历史。在ans = 4×10 logical array 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0 1 0 1 0 0 0

拡張機能

R2008aで導入