このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。
loss
単纯ベイズ分類器の分類損失
说明
例
単纯ベイズ器検定标本分类损失判定判定
単纯ベイズ分類器の検定標本分類誤差 (損失) を判定します。複数のモデルで同じタイプの損失を比較した場合、損失が低い方が予測モデルとして優れていることになります。
渔业
データセットます。150本本のについてについてについてつの花弁测定値が含まれる行列行列X
を作成し。対応するアヤメの種類が含まれる文字ベクトルの cell 配列y
を作成し。
加载渔业x = meas;y =物种;rng('default')%可再现性
y
のクラス情報を使用して、観測値を階層的に学習セットと検定セットに無作為に分割します。テスト用の 30% のホールドアウト標本を指定します。
Cv = cvpartition(Y,'HoldOut',,,,0。30);
学习インデックス検定インデックス抽出します。
traininds =训练(CV);testinds = test(CV);
学習データ セットと検定データ セットを指定します。
Xtrain = X(traininds,:);ytrain = y(traininds);Xtest = x(testinds,:);ytest = y(testinds);
予測子XTrain
とクラス ラベルytrain
を使用して、単純ベイズ分類器に学習させます。クラス名を指定することが推奨されます。F一世tCnb
は,各予測子が条件付き正規分布に従うと仮定しています。
mdl = fitcnb(xtrain,ytrain,'ClassNames',{'setosa',,,,“ versicolor”,,,,'virginica'})
Mdl = ClassificationNaiveBayes ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'setosa' 'versicolor' 'virginica'} ScoreTransform: 'none' NumObservations: 105 DistributionNames: {'normal' 'normal' 'normal' 'normal'} DistributionParameters:{3x4 cell}属性,方法
MDL
は学習させたClassificationNaiveBayes
分類器です。
検定标本を推定て,アルゴリズム一般の精度を特定します。
l=损失(MDL,,,,XTest,YTest)
L = 0.0444
単纯ベイズ分類器は、検定標本のうち約 4% を誤分類しています。
F一世tCnb
で分類器を学習させるときに、より適切な予測子の分布を指定することで、分類誤差を低減できる可能性があります。
単纯ベイズ分類器の検定標本ロジット損失の判定
渔业
データセットます。150本本のについてについてについてつの花弁测定値が含まれる行列行列X
を作成し。対応するアヤメの種類が含まれる文字ベクトルの cell 配列y
を作成し。
加载渔业x = meas;y =物种;rng('default')%可再现性
y
のクラス情報を使用して、観測値を階層的に学習セットと検定セットに無作為に分割します。テスト用の 30% のホールドアウト標本を指定します。
Cv = cvpartition(Y,'HoldOut',,,,0。30);
学习インデックス検定インデックス抽出します。
traininds =训练(CV);testinds = test(CV);
学習データ セットと検定データ セットを指定します。
Xtrain = X(traininds,:);ytrain = y(traininds);Xtest = x(testinds,:);ytest = y(testinds);
予測子XTrain
とクラス ラベルytrain
を使用して、単純ベイズ分類器に学習させます。クラス名を指定することが推奨されます。F一世tCnb
は,各予測子が条件付き正規分布に従うと仮定しています。
mdl = fitcnb(xtrain,ytrain,'ClassNames',{'setosa',,,,“ versicolor”,,,,'virginica'});
MDL
は学習させたClassificationNaiveBayes
分類器です。
検定标本を推定て,アルゴリズム一般の精度を判定します。
l=损失(MDL,,,,XTest,YTest,'LossFun',,,,“ logit”)
l=0。3359
ロジット損失は約 0.34 です。
入力引数
MDL
-単纯ベイズ分類モデル
ClassificationNaiveBayes
モデル オブジェクト|紧凑型班级
モデル オブジェクト
単纯ベイズ分類モデル。F一世tCnb
によって返されるClassificationNaiveBayes
モデル オブジェクト、またはCompact
によって返される紧凑型班级
モデル オブジェクトとして指定します。
tbl
-標本データ
テーブル
モデルをせるに使用する标本テーブルとして指定し。。tbl
の各行は 1 つの観測値に、各列は 1 つの予測子変数に対応します。tbl
には、MDL
のをに使用したすべてすべてががれれなけれなけれなければばなりなりませませませませませませんんん文字文字のののののの配列配列配列ではないではないではないではない配列配列配列とと复数tbl
に応答変数用および観測値の重み用の追加列を含めることができます。
テーブルに格納されている標本データを使用してMDL
の学習を行った場合、loss
の入力データもテーブルに格納されていなければなりません。
ResponseVarName
-応答変数名
tbl
内の変数名前
応答変数の。tbl
内のの名前指定します。
ResponseVarName
には文字ベクトルまたは string スカラーを指定しなければなりません。たとえば、応答変数y
がtbl.y
として格納されている場合、'y'
として指定します。それ以外の場合、tbl
の列はy
を含めすべて予测子扱われます。
MDL
を学习せるに使用た応答変数がtbl
に含まれている場合、ResponseVarName
を指定する必要はありません。
応答変数は、categorical 配列、文字配列、string 配列、logical ベクトル、数値ベクトル、または文字ベクトルの cell 配列でなければなりません。応答変数が文字配列の場合、各要素は配列の 1 つの行に対応しなければなりません。
データ型:Char
|string
X
-予測子データ
数値行列
予测子データ数値行列指定します。
X
ののははつの値(“インスタンス”や“例”ともますます)ににし,列列はははつのつのつの(“特徴”ともます)に対応します。X
の列内の変数は、分類器MDL
に学习た変数同じでなければませ。。。
y
の長さとX
の行数等しくなけれなりません。
データ型:double
|s一世ngle
名前と値のペアの引数
オプションの名称,价值
引数の区ペアを指定し。。Name
は引数名で、价值
は対応するです。Name
は引用符で囲まなければなりません。Name1,Value1,...,NameN,ValueN
のに复数名前とのペア引数を任意の顺番で指定指定。。。
损失(MDL,TBL,Y,“权重”,W)
は,変数w
の各行格纳ている対応するを使用して,tbl
の各行の観測値に重みを付けます。
lossFun
-損失関数
'MinCost'
(既定)|“ Binodeviance”
|'classiferror'
|'exponential'
|'合页'
|“ logit”
|'quadratic'
|关数ハンドル
损失关数。'LossFun'
と损失数または关数から构成れるコンマ切りのペアとして指定指定。。。
次の表は、使用可能な損失関数の一覧です。対応する文字ベクトルまたは string スカラーを使用して、いずれかを指定します。
値 说明 “ Binodeviance”
二項分布からの逸脱度 'classiferror'
10进数の误分类率 'exponential'
指数损失 '合页'
ヒンジ损失 “ logit”
ロジスティック損失 'MinCost'
最小予測誤分類コスト (事後確率である分類スコアの場合) 'quadratic'
二次損失 'MinCost'
は,であるスコアに适しい。既定の设定ではは,単纯単纯ベイズモデルモデルはは分类分类スコアスコアとしてとしてとして事后事后事后(预测
を参照)。关数ハンドルをし独自の关数指定します。
n
はX
内の値の个数,k
は異なるクラスの個数 (numel(mdl.classnames)
。MDL
はモデルであるとし。关数のは次のようになってていなけれなけれなりませ损失价值=
lossfun
((C,,,,s,,,,w,,,,Cost)出力引数
损失价值
はスカラーです。关数名(
lossfun
)を指定し。C
はn
行k
列の logical 行列であり、対応する観測値が属するクラスを各行が示します。列の順序はmdl.classnames
のクラス顺序に対応。。各行について観测値
p
がクラス问
に属する场合はc(p,q)= 1
を设定するにより,C
を作成し。行p
の他すべての要素を0
に設定します。s
は,分類スコアのn
行k
列のです。列ははmdl.classnames
のクラス顺序に対応。。s
は分類スコアの行列で、预测
の出力とです。w
は,観測値の重みのn
行1列の数値ベクトルです。w
を渡す,重みはがが1
になるように正規化されます。Cost
は,誤分類コストの、k
行k
列の行列です。,,成本=一个(k) - 眼(k)
は,分类のコストてて0
を、誤分類のコストとして1
を指定し。
'LossFun',@
を使用ての关数指定します。lossfun
損失関数の詳細については、分类损失を参照してください。
データ型:Char
|string
|function_handle
权重
-観測値の重み
一个(大小(x,1),1)
(既定)|数値ベクトル|tbl
内の変数名前
観测値重み。数値またはまたはtbl
内のの名前指定します。X
またはtbl
の各行に含まれている観測値には、权重
の対応重みがされます。
数値ベクトルで权重
を指定する場合、权重
のサイズはX
またはtbl
の行数等しくなけれなりません。
权重
としてtbl
内のを指定场合,名前文字ベクトルまたはまたはまたはスカラースカラースカラーなければなりませません。。重み重み重み重みTBL.W
として格納されている場合、权重
として'W'
を指定し。それ以外の場合、tbl
の列はTBL.W
を含めすべて予测子扱われます。
損失関数を指定しない場合、权重
は合计が1
になるように正規化されます。
データ型:double
|Char
|string
出力引数
l
-分类损失
スカラー
分类损失スカラーとして返さ。。l
は汎化または再代入品質測定です。解釈は損失関数と加重スキームによって異なります。通常は、優れた分類器の方が損失値がより小さくなります。
详细
分类损失
“分类”关数はの误差を评価しし复数ので同じ同じタイプのの损失损失ををを比较比较たた场合,,损失损失损失ががが低い低い方
以下のを考えます。
lは加重分类损失。。
nは标本。。
バイナリ分類は以下です。
yjは観測されたクラス ラベルです。陰性クラスを示す -1 または陽性クラスを示す 1 (あるいは、
classNames
プロパティのクラス-1または -2番目番目クラスを示す示す示す示す示すををを使用て符号化化。。。。。f(xj)は予測子データ X の観測値 (行) j に対する陽性クラスの分類スコアです。
mj= yjf(xj)は,yjに対応するクラスに観測値 j を分類する分類スコアです。正の値の mjは正しい分類を示しており、平均損失に対する寄与は大きくありません。負の値の mjは正しくを示しおり,平均に寄与寄与ますます。
マルチクラス(つまりつまりk≥ 3)をサポートの场合次のになり。。
yj*は,k- 1 個の 0 と、観測された真のクラス yjに対応位置のからからされるです。たとえば,,,,番目番目番目の値値の真真真のクラスクラスクラスクラスががががががクラスk=4の場合、y2*= [0 0 1 0]''になり。の顺序は入力のの
classNames
プロパティ内顺序に対応。。f(xj)は予測子データXの観測値jに対するクラススコアのベクトルで,長さはKです。スコアの順序は入力モデルの
classNames
プロパティ内クラス顺序に対応し。。mj= yj*'f(xj)。したがって mjは,観測された真のクラスについてモデルが予測するスカラー分類スコアです。
観測値 j の重みは wjです観测のは正规化れ,合计は対応対応事前事前事前确率确率确率にににになりなります。またまたまた,,事前事前事前确率がががががががががががががががががになるになるになるになるになるになるになるになる
この状况は名前とのペアの引数'LossFun'
を使用して指定できる、サポートされる損失関数は次の表のようになります。
損失関数 | lossFun の値 |
式 |
---|---|---|
二項分布からの逸脱度 | “ Binodeviance” |
|
10进数の误分类率 | 'classiferror' |
は,がであるに対応するクラス。。i{ |
クロスエントロピー損失 | “ Crossentropy” |
加重クロスエントロピー損失は次となります。
ここで重み は,合計が 1 ではなく n になるように正規化されます。 |
指数损失 | 'exponential' |
|
ヒンジ损失 | '合页' |
|
ロジット損失 | “ logit” |
|
最小予測誤分類コスト | 'MinCost' |
重み付きの最小予測分類コストは、次の手順を観測値 j = 1、...、n について使用することにより計算されます。
最小误损失の加重平均次となります。
既定のコスト行列 (正しい分類の場合の要素値は 0、誤った分類の場合の要素値は 1) を使用する場合、 |
二次損失 | 'quadratic' |
次のでは,,,つの観测値スコアスコアスコアに対する“ Crossentropy”
および'MinCost'
を除く) を比較しています。いくつかの関数は、点 (0,1) を通過するように正規化されています。
誤分類コスト
“误分类”は,観測を誤ったクラスにラベル付けする分類器の相対的な重大度です。
误分类コスト,の误分类コスト误分类コストコストののの种类种类がありあり。。。ををを
"真の誤分類コスト"- k行k列行列,がががが(i,j)はは観测クラスクラスクラスクラスででで予测予测
MDL。Cost
に格納され、計算に使用されます。既定の設定では、一世
≠j
の場合にMDL.COST(I,J)
= 1でで一世
=j
の場合MDL.COST(I,J)
=0です。つまり、正しい分類のコストは0
で,た分类では1
です。“予测误コスト”-k次元のベクトルで、ここで、要素 k はクラス事後確率で重み付けされるクラス k に観測値を分類する加重平均誤分類コストです。
つまり,は低い予测误分类に対応クラスに分类されます。
事后确率
“事后”はデータられるに,観测値特定クラスに属して确率です。
単纯ベイズの,与えた観测(x1,...,Xp)のががになる确率次のになります。
ここで
は,予測子がクラス k に含まれる場合の条件付き同時密度です。予測子の分布名は
MDL。DistributionNames
に格納します。π(y = k)はクラス事前の分布。。
mdl.prior
は事前を保存し。。は予测子密度。各は离散なので次のようになります。
事前確率
クラスの“事前”は,母集団内でそのクラスの観測値が出現すると考えられる相対頻度です。
拡張機能
tall 配列
メモリの超えるな多数の行配列を计算し。。
この関数は、tall 配列を完全にサポートします。この関数でインメモリ データまたは tall データに対して学習を行ったモデルを使用できます。
详细は,tall 配列を参照してください。
MATLAB コマンド
次の MATLAB コマンドに対応するリンクがクリックされました。
コマンドを MATLAB コマンド ウィンドウに入力して実行してください。Web ブラウザーは MATLAB コマンドをサポートしていません。
选择一个网站
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select:。
您还可以从以下列表中选择一个网站:
How to Get Best Site Performance
选择中国网站(中文或英语)以获得最佳场地性能。其他Mathworks乡村网站未针对您所在的访问进行优化。
美洲
- América Latina(Español)
- 加拿大((英语)
- 美国((英语)
欧洲
- Netherlands((英语)
- 挪威((英语)
- Österreich(德意志)
- 葡萄牙((英语)
- sweden((英语)
- 瑞士
- United Kingdom((英语)