主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

logp

単純ベイズ分類器の対数条件なし確率密度

説明

lp= logp (Mdl资源描述は,単純ベイズモデルMdlを使用して资源描述の観測値(行)の対数条件なし確率密度lp)を返します。lpを使用して学習データ内の外れ値を特定できます。

lp= logp (MdlXは,単純ベイズモデルMdlを使用してXの観測(行)の対数条件なし確率密度を返します。

すべて折りたたむ

単純ベイズ分類器モデルの標本内観測値の条件なし確率密度を計算します。

fisheririsデータセットを読み込みます。150 本のアヤメについて 4 つの花弁の測定値が含まれる数値行列Xを作成します。対応するアヤメの種類が含まれる文字ベクトルの细胞配列Yを作成します。

负载fisheririsX =量;Y =物种;

予測子XとクラスラベルYを使用して,単純ベイズ分類器に学習させます。クラス名を指定することが推奨されます。fitcnbは,各予測子が条件付き正規分布に従うと仮定しています。

Mdl = fitcnb (X, Y,“类名”, {“setosa”“多色的”“virginica”})
Mdl = ClassificationNaiveBayes ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'setosa' 'versicolor' 'virginica'} ScoreTransform: 'none' NumObservations: 150 DistributionNames: {'normal' 'normal' 'normal' 'normal'} DistributionParameters: {3x4 cell}属性,方法

Mdlは学習させたClassificationNaiveBayes分類器です。

標本内観測の条件なし確率密度を計算します。

lp = logp (Mdl X);

非常に小さいまたは非常に大きい対数条件なし確率をもつ観測値のインデックスを特定します(印第安纳州)。外れ値検出メソッドで使用された下限(l)および上限(U)のしきい値を表示します。

(TF, L, U) = isoutlier (lp);l
L = -6.9222
U
U = 3.0323
印第安纳州=找到(TF)
印第安纳州=4×161 118 119 132

外れ値の条件なし確率密度の値を表示します。

lp(印第安纳州)
ans =4×1-7.8995 -8.4765 -6.9854 -7.8969

すべての外れ値は,外れ値検出の下限のしきい値よりも小さくなっています。

条件なし確率密度をプロットします。

直方图(lp)参照线(L,“k——”)举行包含(“日志无条件概率”) ylabel (“频率”)标题(“直方图:日志无条件概率”

图中包含一个轴。轴标题直方图:日志无条件概率包含2个直方图类型的对象,常数线。

入力引数

すべて折りたたむ

単純ベイズ分類モデル。fitcnbによって返されるClassificationNaiveBayesモデルオブジェクト,または紧凑的によって返されるCompactClassificationNaiveBayesモデルオブジェクトとして指定します。

モデルを学習させるために使用する標本データ。テーブルとして指定します。资源描述の各行は1つの観測値に,各列は1つの予測子変数に対応します。资源描述には,Mdlの学習を行うために使用したすべての予測子が含まれていなければなりません。文字ベクトルの细胞配列ではない细胞配列と複数列の変数は使用できません。必要に応じて,资源描述に応答変数用および観測値の重み用の追加列を含めることができます。

テーブルに格納されている標本データを使用してMdlの学習を行った場合,logpの入力データもテーブルに格納されていなければなりません。

予測子データ。数値行列として指定します。

Xの各行は1つの観測値(“インスタンス”や“例”とも呼ばれます)に対応し,各列は1つの変数(“特徴”とも呼ばれます)に対応します。Xの列内の変数は,分類器Mdlに学習させた変数と同じでなければなりません。

Yの長さとXの行数は等しくなければなりません。

データ型:|

詳細

すべて折りたたむ

条件なし確率密度

予測子の“条件なし確率密度”はクラスで重視されない密度の分布です。

つまり,条件なし確率密度は次のようになります。

P X 1 .. X P k 1 K P X 1 .. X P Y k k 1 K P X 1 .. X P | y k π Y k

ここで,π(Y = k)はクラスの事前確率です。クラス(P (X1. . XP| y = k)に対するデータの条件付き分布およびクラスの事前確率分布が,学習オプションになります(つまり,分類器を学習させるときにそれらを指定します)。

事前確率

クラスの"事前確率"は,母集団内でそのクラスの観測値が出現すると考えられる相対頻度です。

R2014bで導入