主要内容

このペジの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

CompactClassificationTree

パッケジ:classreg.learning.classif

コンパクトな分類木

説明

コンパクトなバジョンの分類木(クラスはClassificationTree)。コンパクトなバジョンには,分類木の学習のためのデタが含まれません。そのため,コンパクトな分類木では,交差検証などの一部のタスクを実行できません。コンパクトな分類木は、新しいデータの予測 (分類) を行うために使用してください。

構築

ctree=紧凑(は,完全な決定木からコンパクトな決定木を構築します。

入力引数

fitctreeを使用して構築された決定木。

プロパティ

CategoricalPredictors

カテゴリカル予測子の邮箱ンデックス。正の整数のベクトルを指定します。CategoricalPredictorsには,カテゴリカル予測子が含まれている予測子デンデックス値を格納します。どの予測子もカテゴリカルではない場合,このプロパティは空([]になります。

CategoricalSplits

N行2列のcell配列。ここでnは,内のカテゴリカル分割の数です。CategoricalSplitsの各行は,カテゴリカル分割用の左と右の値になります。カテゴリカル予測子変数zに基づくカテゴリカル分割をも各枝ノドjにおいて,zCategoricalSplits (j, 1)にあれば左の子を選択し,zCategoricalSplits (j, 2)にあれば右の子を選択します。分割はリのノドと同じ順序で行われます。CutTypeプロパティの“分类”切り取りを上から下に選択することによって,これらの分割のノドを検出します。

孩子们

の各ノドの子ノドの数を含むn行2列の配列。ここで,nはノドの数です。葉ノドは子ノド0をもます。

ClassCount

のノドのクラスカウントを表すn行k列の配列。ここで,nはノド数,kはクラス数となります。任意のノド番号に対して,クラスカウントClassCount(我,:)はノドの条件を満たす各クラスからの(リの近似に使用したデタからの)観測カウント数です。

一会

重複が削除されたYの要素のリスト。一会には,数値ベクトル,カテゴリカル変数のベクトル,逻辑ベクトル,文字配列,文字ベクトルの细胞配列のいずれかを指定できます。一会は,引数Yのデタと同じデタ型です。(字符串配列は文字ベクトルのcell配列として扱われます)。

長さがkの次元が少なくとも1のプロパティの値に含まれている場合,一会ではその次元に沿って(成本之前などの)要素の順序を指定します。

ClassProbability

のノドのクラス確率を表すn行k列の配列。ここで,nはノド数,kはクラス数となります。任意のノド番号に対して,クラス確率ClassProbability(我,:)は,ノドの条件を満たすポ邮箱ントに対する各クラスの推定確率です。

成本

正方行列。成本(i, j)は真のクラスがである点をクラスjに分類するコストです(行は真のクラス,列は予測したクラスに対応します)。成本の行と列の順序は,一会のクラスの順序に対応します。成本の行および列の数は,応答に含まれている一意なクラスの数です。このプロパティは読み取り専用です。

CutCategories

の分岐で使用されたカテゴリを表すn行2列のcell配列。Nはノド数です。カテゴリカル予測子変数xに基づく各枝ノドに対して,xCutCategories{1},我内のカテゴリである場合は左側の子が選択され,xCutCategories{2},我内のカテゴリである場合は右側の子が選択されます。連続予測子に基づく枝ノドと葉ノドに対するCutCategoriesの列は両方とも空です。

割点には“连续”切り取りの切り取り点が含まれ,CutCategoriesにはカテゴリセットが含まれます。

割点

の切り取り点として使用される値を表す要素数nのベクトル。ここで,nはノド数です。連続予測子変数xに基づく各枝ノドにおいて,x <割点(我)の場合は左側の子が選択され,x > =割点(我)の場合は右側の子が選択されます。カテゴリカル予測子に基づく枝ノドと葉ノドに対する割点です。

割点には“连续”切り取りの切り取り点が含まれ,CutCategoriesにはカテゴリセットが含まれます。

CutType

の各ノドの切り取りのタのcell配列。ここで,nはノド数です。各ノドに対してCutType{我}は次のいずれかです。

  • “连续”——変数xと切り取り点vに対して,切り取りがx < v形式で定義されている場合。

  • “分类”——変数xがカテゴリセット内の値を受け取るかどうかによって切り取りが定義されている場合。

  • - - - - - -が葉ノドの場合。

割点には“连续”切り取りの切り取り点が含まれ,CutCategoriesにはカテゴリセットが含まれます。

CutPredictor

の各ノドの分岐に使用された変数名を示す要素数nの单元配列。Nはノド数です。これらの変数は,“切り取り変数”と呼ばれることもあります。葉ノドの場合,CutPredictorには空の文字ベクトルが格納されます。

割点には“连续”切り取りの切り取り点が含まれ,CutCategoriesにはカテゴリセットが含まれます。

CutPredictorIndex

の各ノドで分岐に使用される変数を対象とした,数値n要素配列。Nはノド数です。詳細は,CutPredictorを参照してください。

ExpandedPredictorNames

展開された予測子名。文字ベクトルのcell配列として格納されます。

モデルがカテゴリカル変数用のエンコディングを使用している場合,ExpandedPredictorNamesには展開された変数を表す名前が格納されます。それ以外の場合,ExpandedPredictorNamesPredictorNamesと同じです。

IsBranchNode

N要素の逻辑ベクトルであり,の各枝ノドの場合は真正的,各葉ノドの場合はになります。

NodeClass

の各ノドで最も確からしいクラスの名前とn要素の单元配列。ここでnはリのノド数を示します。この配列の各要素は,一会に含まれているクラス名のいずれかに等しい文字ベクトルです。

NodeError

に含まれるノドの誤差のn要素のベクトル。ここで,nはノド数です。NodeError(我)は,ノドの誤分類の確率です。

NodeProbability

に含まれるノドの確率のn要素のベクトル。ここで,nはノド数です。ノドの確率は,ノタから,観測の比率として計算されます。この比率は,各クラスに割り当てられている前の確率に対して調整されます。

NodeRisk

リに含まれるノドのリスクを表すn要素のベクトル。ここで,nはノド数です。各ノドのリスクは、ノード確率で重みが付けられたこのノードの不純度の測定基準 (ジニ指数または逸脱度) です。ツリーが twoing によって成長した場合、各ノードのリスクはゼロです。

NodeSize

に含まれるノドのサ。ここで,nはノド数です。ノードのサイズは,ノードの条件を満たすツリーを作成するために使用されるデータから,観測数として定義されます。

NumNodes

のノド数。

に含まれる各ノドの親ノドの数を含むn要素のベクトル。ここで,nは,ノド数です。ルトノドの親は0です。

PredictorNames

予測子変数の名前のcell配列。並びはXに現れる順です。

之前

各クラスの事前確率の数値ベクトル。之前の要素の順序は,一会のクラスの順序に対応します。之前の要素数は,応答に含まれている一意なクラスの数です。このプロパティは読み取り専用です。

PruneAlpha

枝刈りレベルごとに1の要素をも数値ベクトル。枝刈りレベルの範囲が0 ~ mの場合,PruneAlphaには昇順に並べ替えられたm + 1要素が含まれます。PruneAlpha (1)は枝刈りレベル0(枝刈りなし)を表し,PruneAlpha (2)は枝刈りレベル1を表すというように続いていきます。

PruneList

の各ノドの枝刈りレベルをも。ここでnはノド数を示します。枝刈りレベルの範囲は0(枝刈りなし)からmです。Mは最下位の葉からルトノドまでの距離です。

ResponseName

応答変数Yを表す文字ベクトル。

ScoreTransform

スコア変換用の関数ハンドル,または組み込みの変換関数を表す文字ベクトル。“没有”は変換なしを意味します。等価的には,“没有”@ x (x)です。組み込みの変換関数のリストとカスタム変換関数の構文は,fitctreeを参照してください。

ドット表記を使用して関数ScoreTransformを追加または変更します。

ctree。ScoreTransform = 'function'或ctree。ScoreTransform = @function

SurrogateCutCategories

の代理分岐に使用するカテゴリのn要素のcell配列。ここでnはのノド数です。各ノドkに対して,SurrogateCutCategories {k}はcell配列です。SurrogateCutCategories {k}の長さは,このノ。SurrogateCutCategories {k}の各要素は,連続代理予測子の場合は空の文字ベクトル,カテゴリカル代理予測子の場合はカテゴリをもつ2要素细胞配列になります。2要素 cell 配列の最初の要素には、この代理分岐によって左の子に割り当てられたカテゴリがリストされ、この 2 要素 cell 配列の 2 番目の要素には、この代理分岐によって右の子に割り当てられたカテゴリがリストされます。各ノードの代理分岐変数の順序は、SurrogateCutVarに存在する変数の順序に一致します。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合,SurrogateCutCategoriesには空のセルが含まれます。

SurrogateCutFlip

の代理分岐に使用する数値切り取り点のn要素のcell配列。ここでnはのノド数です。各ノドkに対して,SurrSurrogateCutFlip {k}は数値ベクトルです。SurrogateCutFlip {k}の長さは,このノ。SurrogateCutFlip {k}の各要素はカテゴリカル代理予測子でゼロになるか,連続代理予測子で数値切り取り点の割り当てになります。数値切り取り点の割り当ては,-1または+1のいずれかになります。連続予測子変数Zに基づく数値切り取り C が含まれるすべての代理分岐では、Z < Cであり,その代理分岐の切り取りの割り当てが+1である場合,またはZ≥Cであり,その代理分岐の切り取りの割り当てが-1である場合,左の子が選択されます。同様に,Z≥Cであり,その代理分岐の切り取り点割り当てが+1である場合,またはZ < Cであり,その代理分岐の切り取り点が-1である場合,右の子が選択されます。各ノドにおける代理分岐変数の順序は,SurrogateCutPredictorによって返される変数の順序に一致します。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合,SurrogateCutFlipには空の配列が含まれます。

SurrogateCutPoint

の代理分岐に使用される数値のn要素のcell配列。ここでnはのノド数です。各ノドkに対して,SurrogateCutPoint {k}は数値ベクトルです。SurrogateCutPoint {k}の長さは,このノ。SurrogateCutPoint {k}の各要素は,カテゴリカル代理予測子でになるか,連続代理予測子で数値切り取り点になります。連続予測子変数Zに基づく数値切り取り C が含まれるすべての代理分岐では、Z < Cであり,その代理分岐のSurrogateCutFlipが+1である場合,またはz≥cであり,その代理分岐のSurrogateCutFlipが-1である場合,左の子が選択されます。同様に,Z≥Cであり,その代理分岐のSurrogateCutFlipが+1である場合,またはZ < Cであり,その代理分岐のSurrogateCutFlipが-1である場合,右の子が選択されます。各ノドの代理分岐変数の順序は,SurrogateCutPredictorによって返される変数の順序に一致します。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合,SurrogateCutPointには空のセルが含まれます。

SurrogateCutType

の各ノドの代理分岐のタ要素のcell配列。ここでnはのノド数です。各ノドのkで,SurrogateCutType {k}はこのノドの代理分岐変数のタ。変数は,最適予測子との結びつきの予測尺度によって降順に並べ替えられており,かつ正の予測尺度をもつ変数のみが含まれています。各ノドにおける代理分岐変数の順序は,SurrogateCutPredictorによって返される変数の順序に一致します。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合,SurrogateCutTypeには空のセルが含まれます。代理分岐のタプは,切り取りが変数Zに対してZ<Vの形式で定義されている場合は“连续”に,切り取りがZがカテゴリのセットの値を取るかどうかによって定義されている場合は切り取り点Vまたは“分类”のいずれかになります。

SurrogateCutPredictor

の各ノドで代理分岐に使用する変数の名前のn要素の单元配列。ここでnはのノド数です。SurrogateCutPredictorの各要素は,このノ细胞配列です。変数は,最適予測子との結びつきの予測尺度によって降順に並べ替えられており,かつ正の予測尺度をもつ変数のみが含まれています。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合,SurrogateCutPredictorには空のセルが含まれます。

SurrogatePredictorAssociation

の代理分岐に使用する関連性予測尺度のn要素のcell配列。ここでnはのノド数です。各ノドkに対して,SurrogatePredictorAssociation {k}は数値ベクトルです。SurrogatePredictorAssociation {k}の長さは,このノ。SurrogatePredictorAssociation {k}の各要素は,最適分割とこの代理分岐間の関連性予測尺度を与えます。各ノドの代理分岐変数の順序は,SurrogateCutPredictorに存在する変数の順序になります。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合,SurrogatePredictorAssociationには空のセルが含まれます。

オブジェクト関数

compareHoldout 新しいデタを使用して2の分類モデルの精度を比較
边缘 分類エッジ
石灰 局部可解释模型不可知解释(LIME)
损失 分類誤差
保证金 分類マジン
partialDependence 部分従属の計算
plotPartialDependence 部分依存プロット(pdp)および個別条件付き期待値(ice)プロットの作成
预测 分類木の使用によるラベルの予測
predictorImportance 分類木の予測子の重要度の推定
沙普利 シャプレ
surrogateAssociation 分類木における代理分岐に対する関連性の平均予測尺度
更新 コド生成用にモデルパラメタを更新
视图 分類木の表示

コピのセマンティクス

値。値のクラスがコピ操作に与える影響にいては,オブジェクトのコピを参照してください。

すべて折りたたむ

フィッシャのアヤメのデタのコンパクトな分類木を構築します。

负载fisheriris树= fitctree(量、种类);ctree =紧凑(树);

生成された木のサ邮箱ズと元の木のサ邮箱ズを比較します。

t =谁(“树”);% t.bytes =以字节为单位的树大小c =谁(“ctree”);% c.bytes = ctree的大小,单位为字节[c。字节t.bytes]
ans =1×25097 11762

コンパクトな木は元の木より小さくなっています。

詳細

すべて展開する

拡張機能

R2011aで導入