Main Content

error

クラス:TreeBagger

誤差 (誤分類の確率または MSE)

構文

err = error(B,TBLnew,Ynew)
err =错误(b,Xnew,ynew)
err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)
err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...)

説明

err = error(B,TBLnew,Ynew)は、与えられた真の応答Ynewを使用して、テーブルTBLnewに格納されている予測子に対する分類木の誤分類確率または各木の回帰木の平均二乗誤差 (MSE) を計算します。TBLnewに応答変数が含まれている場合、Ynewを省略できます。テーブルに格納されている標本データを使用してBの学習を行った場合、このメソッドの入力データもテーブルに格納されていなければなりません。

err =错误(b,Xnew,ynew)は、与えられた真の応答Ynewを使用して、行列Xnewに格納されている予測子に対する分類木の誤分類確率または各木の回帰木の平均二乗誤差 (MSE) を計算します。行列に含まれている標本データを使用してBを学習させた場合、このメソッドの入力データも行列でなければなりません。

分類の場合、Ynewは数値ベクトル、文字行列、string 配列、文字ベクトルの cell 配列、categorical ベクトル、logical ベクトルが可能です。回帰木の場合、Yは数値ベクトルでなければなりません。errは、アンサンブルBNTreesツリーごとにつ误差基准もつもつ。。。

err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)またはerr = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...)では、オプション パラメーターの名前と値のペアを指定します。

“模式” 誤差の計算方法を示す文字ベクトルまたは string スカラー。'cumulative'(既定)に设定し场合,errorは累积を计算し。。errは長さがNTreesのベクトルになり、1 番目の要素はtrees(1)の误差を,,番目の要素ははtrees(1:2)の誤差を与え、trees(1:NTrees)まで他の要素についても同様になります。'individual'に設定すると、errは長さNTreesのベクトルになります。ここで、各要素はアンサンブル内のそれぞれのツリーからの誤差です。'ensemble'に設定すると、errはアンサンブル全体の累積誤差を示すスカラーとなります。
“重量” 誤差の平均化に使用する観測値の重みのベクトル。既定の設定では、それぞれの観測値の重みは 1 です。このベクトルの長さはXの行数と等しくなければなりません。
'Trees' この計算に含めるツリーを示すインデックスのベクトル。既定の設定では、この引数は'all'に设定れメソッドすべてのツリー使用します。'Trees'が数値である场合,はは'cumulative'モードと'individual'モードでは長さNTreesのベクトルを返します。ここで、NTreesは入力ベクトルの要素数です。'ensemble'モードではスカラーを返します。たとえば、'cumulative'モードで、最初の要素はtrees(1)からの誤差を出力し、2 番目の要素はtrees(1:2)からの誤差を出力し、以下同様です。
'TreeWeights' ツリーの重みのベクトル。このベクトルは、'Trees'ベクトルと同じ長さでなければなりません。このメソッドは、簡単な重み付けされていない多数決の代わりに重み付けされた平均を取得することによって、これらの重みを使用して指定したツリーからの出力を結合します。'individual'モードで引数使用するはできません。
'UseInstanceForTree' 観測ごとの予測を行うために使用する必要があるツリーを示す、サイズNobsNTrees逻辑行列行列既定のではこのメソッドはすべて観测観测のすべてののツリーをを。。。

アルゴリズム

アンサンブル误差推定するときに

  • 名前と値のペアの引数“模式”を使用すると、次の 3 つの方法のいずれかで誤差を返すように指定できます。

    • アンサンブル内の個々の木の誤差

    • すべての木の累積誤差

    • アンサンブル全体の誤差

  • 名前と値のペアの引数'Trees'を使用すると、どの木をアンサンブル誤差の計算で使用するかを指定できます。

  • 名前と値のペアの引数'UseInstanceForTree'を使用すると、選択した木のそれぞれについてのアンサンブル誤差の計算で入力データ (XおよびY) のどの観測値を使用するかを指定できます。

  • 名前と値のペアの引数“重量”を使用すると、各 "観測値"に重みを割り当てることができます。以下の式では、wjは観測値 j の重みです。

  • 名前と値のペアの引数'TreeWeights'を使用と各各“木”に重みを割り当てることができます。

回帰問題の場合、errorは与えられたXに対してYを予測するために、選択された木と観測値を使用して、バギング回帰木のアンサンブルについて重みを付けた MSE を推定します。

  1. errorは,内选択れた回帰木使用して,X内の選択された観測値の応答を予測します。

  2. MSE の推定は、“模式”の値によって異なります。

    • “模式”,'Individual'を指定した場合、木 t の重み付き MSE は次のようになります。

      MSE t = 1 j = 1 n w j j = 1 n w j ( y j y ^ t j ) 2 .

      y ^ t j は、選択された回帰木 t からの観測値 j の予測された応答です。errorは、選択された木で未選択の観測値を、観測された学習データ応答値の加重標本平均に設定します。

    • “模式”,'Cumulative'を指定した場合、重み付き MSE は、T*≤ T 本の選択された木に対する累積的な重み付き MSE が格納されている、サイズが T*のベクトルになります。errorは次のステップに従い、選択された最初の t 本の木を使用して重み付き累積 MSE、MSEt*を推定します。

      1. errorは、選択された観測値 j (j = 1,...,n) について、選択された最初の t 本の木における予測子の加重平均 y ^ , t j を推定します (詳細は预测を参照してください)。この計算で、errorは木の重みを使用します。

      2. errorは、木 t までの重み付き累積 MSE を推定します。

        MSE t = 1 j = 1 n w j j = 1 n w j ( y j y ^ , t j ) 2 .

      errorは、選択されたすべての木における未選択の観測値を、観測された学習データ応答値の加重標本平均に設定します。

    • “模式”,'Ensemble'を指定した場合、重み付き MSE は重み付き累積 MES ベクトルの最後の要素になります。

分类问题の,errorは与えられたXに対してYを予測するために、選択された木と観測値を使用して、バギング分類木のアンサンブルについて重みを付けた誤分類率を推定します。

  • “模式”,'Individual'を指定した場合、木 t の重み付き誤分類率は次のようになります。

    e t = 1 j = 1 n w j j = 1 n w j I ( y j y ^ t j ) .

    y ^ t j は、選択された分類木 t を使用して選択された観測値 j について予測されたクラスです。errorは、選択された木で未選択の観測値を、すべての学習応答値について予測され、重み付けられた最も一般的なクラスに設定します。最も一般的なクラスが複数ある場合、errorTreeBaggerモデルのClassNamesプロパティで最初にリストされているものを最も一般的であると見なします。

  • “模式”,'Cumulative'を指定した場合、重み付き誤分類率は、T*≤ T 本の選択された木に対する累積的な重み付き誤分類率が格納されている、サイズが T*のベクトルになります。errorは次のステップに従い、選択された最初の t 本の木を使用して重み付き累積誤分類率 et*を推定します。

    1. errorは、選択された観測値 j (j = 1,...,n) について、選択された最初の t 本の木における重み付けされた、最も一般的なクラス y ^ , t j を推定します (詳細は预测を参照してください)。この計算で、errorは木の重みを使用します。

    2. errorは、木 t までの重み付き累積誤分類率を推定します。

      e t = 1 j = 1 n w j j = 1 n w j I ( y j y ^ , t j ) .

      errorは、選択されたすべての木における未選択の観測値を、すべての学習応答値について予測され、重み付けられた最も一般的なクラスに設定します。最も一般的なクラスが複数ある場合、errorTreeBaggerモデルのClassNamesプロパティで最初にリストされているものを最も一般的であると見なします。

  • “模式”,'Ensemble'を指定した場合、重み付き誤分類率は重み付き累積誤分類率ベクトルの最後の要素になります。