このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。
決定木の袋树
TreeBagger
は,分類または回帰のいずれかについて決定木のアンサンブルをバギングします。”“バギングとは”,引导聚合”を意味します。アンサンブル内の各ツリーは,個々に抽出された入力データのブートストラップ複製上で成長します。この複製に含まれない観測値は,このツリーにとって“袋”となります。
個別のツリーの成長に関して,TreeBagger
はClassificationTree
とRegressionTree
の機能に依存します。特に,ClassificationTree
とRegressionTree
は各決定分岐について無作為に選択された特徴量の個数をオプションの入力引数として受け入れます。つまり,TreeBagger
はランダムフォレストアルゴリズム[1]を実装します。
回帰問題の場合,TreeBagger
は平均および分位点回帰 (つまり、分位点回帰フォレスト[2])をサポートします。
与えられたデータに対する平均応答の予測または平均二乗誤差の推定を行うには,TreeBagger
モデルとデータを预测
または错误
にそれぞれ渡します。现成的観測値について同様の操作を実行するには、OOB预测
またはoobError
を使用します。
与えられたデータに対する応答分布の分位数または分位数誤差を推定するには、TreeBagger
モデルとデータをquantilePredict
またはquantileError
にそれぞれ渡します。现成的観測値について同様の操作を実行するには、oobQuantilePredict
またはoobQuantileError
を使用します。
TreeBagger | 決定木の 一袋树の作成 |
附加 |
アンサンブルに新しいツリーを追加する |
紧凑的 |
決定木のコンパクトなアンサンブル |
错误 |
誤差(誤分類の確率またはMSE) |
fillprox |
学習データの近接行列 |
种树 |
追加のツリーの育成とアンサンブルへの追加 |
边缘 |
分類マージン |
mdsprox |
近接行列の多次元尺度構成法 |
meanMargin |
平均分類マージン |
oobError |
现成的誤差 |
oobMargin |
现成的マージン |
oobMeanMargin |
现成的平均マージン |
OOB预测 |
out-of-bag観測に対するアンサンブル予測 |
oobQuantileError |
回帰の袋树のout-of-bag分位点損失 |
oobQuantilePredict |
回帰の 一袋树による 现成的観測値の分位数予測 |
partialDependence |
部分従属の計算 |
plotPartialDependence |
部分依存プロット(PDP)および個別条件付き期待値(ICE)プロットの作成 |
预测 |
バギングされた決定木のアンサンブルの使用による応答の予測 |
quantileError |
回帰の袋树の使用による分位点損失 |
quantilePredict |
回帰の袋树の使用による応答の分位数の予測 |
|
応答変数 |
|
観測の学習用にout-of-bag予測を計算するかどうかを指定する論理フラグです。既定の設定は このフラグが
このフラグが
|
|
変数の重要度のout-of-bag推定を計算するかどうかを指定する論理フラグです。既定の設定は このフラグが
|
|
正方行列。 このプロパティは次のようになります。
|
|
|
|
各変数の分割全体で合計され、成長したツリーのアンサンブル全体で平均化された分割基準の変化を示す、サイズが 1.行 Nvars列の数値配列です。 |
|
各ブートストラップ複製について復元抽出により無作為に選択される観測値の比率。各複製のサイズは,脑袋× |
|
同じ親をもつ決定木の葉を,総リスクを減少させない分割のためにマージするかどうかを指定する論理フラグ。既定値は |
|
ツリーで使用されるメソッド。アンサンブル分類には |
|
ツリー リーフ 1.枚あたりの観測値の最小個数。 |
|
アンサンブル内の決定木の数と等しいスカラー値。 |
|
1.行Nvars列のサイズの数値配列であり、各要素はそれぞれの予測子による分割数を、すべてのツリーで合計したものです。 |
|
各決定分岐で無作為に選択する予測子変数または特徴変数の個数。既定では、 |
|
脑袋行NumTrees列の逻辑配列。脑袋は学習データの観測数,NumTreesはアンサンブル内のツリーの数です。(i, j)要素の値が |
|
観測ごとのout-of-bag応答を計算するために使用されたツリーの数を含む,脑袋行1列の数値配列。脑袋はアンサンブルの作成に使用された学習データの観測数です。 |
|
1行据nvar列のサイズの数値配列であり,予測子変数(特徴量)ごとの変数重要度の尺度を含みます。いずれの変数の場合も,その変数の値がout-of-bag観測内で並べ替えられた場合に,上昇した分離マージンの数と低下した分離マージンの数との差が尺度になります。この尺度はツリーごとに計算され,アンサンブル全体で平均化されてから,アンサンブル全体の標準偏差で除算されます。回帰木の場合,このプロパティは空です。 |
|
1.行 Nvars列のサイズの数値配列であり、予測子変数 (特徴量) ごとの重要度の尺度を含みます。いずれの変数の場合も、その変数の値が 现成的観測内で並べ替えられた場合、予測誤差の増加を尺度とします。この尺度はツリーごとに計算され、アンサンブル全体で平均化されてから、アンサンブル全体の標準偏差で除算されます。 |
|
1行据nvar列のサイズの数値配列であり,予測子変数(特徴量)ごとの重要度の尺度を含みます。いずれの変数の場合も,その変数の値がout-of-bag観測内で並べ替えられた場合,分類マージンの減少を尺度とします。この尺度はツリーごとに計算され,アンサンブル全体で平均化されてから,アンサンブル全体の標準偏差で除算されます。回帰木の場合,このプロパティは空です。 |
|
诺布行 1.列のサイズの数値配列です。诺布は学習データ内の観測値数で、観測ごとの外れ値の尺度を含んでいます。 |
|
各クラスの事前確率の数値ベクトル。 このプロパティは次のようになります。
|
|
脑袋行脑袋列のサイズの数値行列です。脑袋は学習データ内の観測値数で,観測値間の近接度を含んでいます。任意の2つの観測値の近接度は,これらの観測値がツリーの同じリーフに着地する比率として定義されます。これは1の対角要素と0 ~ 1の範囲の非対角要素をもつ対称行列です。 |
|
|
|
決定木ごとにデータが復元抽出されるかどうかを指定する論理フラグです。 |
|
|
|
アンサンブル内のツリーを格納するサイズNumTrees行1列の细胞配列です。 |
|
据nvar行据nvar列のサイズをもち,変数の関連性予測尺度を成長したツリーのアンサンブル全体で平均化した行列。アンサンブルの設定を |
|
予測子変数 (特徴量) の名前が含まれている 单间牢房配列。これらの名前を |
|
長さ脑袋の重みの数値ベクトル。ここで脑袋は学習データの観測(行)数です。 |
|
サイズが脑袋行据nvar列のテーブルまたは数値行列。脑袋は学習データの観測値(行)の数,据nvarは変数(列)の数です。予測子値のテーブルを使用してアンサンブルに学習をさせた場合, |
|
サイズが 诺布の応答データの配列。 |
値。これがクラスの使用に与える影響については,MATLAB®オブジェクト指向プログラミング”ドキュメンテーションのハンドル クラスと値クラスの比較を参照してください。
TreeBagger
モデル オブジェクトB
の树
プロパティには,B.NumTrees
個の紧分类树
または紧回归树
モデルオブジェクトが含まれている细胞ベクトルが格納されます。细胞ベクトルの木t
をテキストまたはグラフィックで表示するには,次のように入力します。
视图(B.Trees {t})
统计和机器学习工具箱™には,バギングおよびランダムフォレスト用に3つのオブジェクトが用意されています。
菲特森布尔
によって作成される,分類用の分类BaggedAssemble
fitrensemble
によって作成される,回帰用の回归分析
TreeBagger
によって作成される、分類および回帰用のTreeBagger
TreeBagger
とバギング アンサンブル (分类BaggedAssemble
および回归分析
)の違いについては,TreeBaggerとバギングアンサンブルの比較を参照してください。
[1] 《随机森林》,机器学习45,第5-32页,2001年。
[2] Meinshausen, N.“分位数回归森林”《机器学习研究》,2006年第7卷,第983-999页。