CompactClassificationTree

パッケジ:classreg.learning.classif

コンパクトな分類木

説明

コンパクトなバジョンの分類木(クラスはClassificationTree)。コンパクトなバジョンには，分類木の学習のためのデタが含まれません。そのため，コンパクトな分類木では，交差検証などの一部のタスクを実行できません。コンパクトな分類木は、新しいデータの予測 (分類) を行うために使用してください。

構築

ctree=紧凑(树）は，完全な決定木からコンパクトな決定木を構築します。

入力引数

`树`	`fitctree`を使用して構築された決定木。

プロパティ

`CategoricalPredictors`	カテゴリカル予測子の邮箱ンデックス。正の整数のベクトルを指定します。`CategoricalPredictors`には，カテゴリカル予測子が含まれている予測子デンデックス値を格納します。どの予測子もカテゴリカルではない場合，このプロパティは空(`［］`になります。
`CategoricalSplits`	N行2列のcell配列。ここでnは，`树`内のカテゴリカル分割の数です。`CategoricalSplits`の各行は，カテゴリカル分割用の左と右の値になります。カテゴリカル予測子変数`z`に基づくカテゴリカル分割をも各枝ノド`j`において，`z`が`CategoricalSplits (j, 1)`にあれば左の子を選択し，`z`が`CategoricalSplits (j, 2)`にあれば右の子を選択します。分割はリのノドと同じ順序で行われます。`CutType`プロパティの`“分类”`切り取りを上から下に選択することによって，これらの分割のノドを検出します。
`孩子们`	`树`の各ノドの子ノドの数を含むn行2列の配列。ここで，nはノドの数です。葉ノドは子ノド`0`をもます。
`ClassCount`	`树`のノドのクラスカウントを表すn行k列の配列。ここで，nはノド数，kはクラス数となります。任意のノド番号`我`に対して，クラスカウント`ClassCount(我,:)`はノド`我`の条件を満たす各クラスからの(リの近似に使用したデタからの)観測カウント数です。
`一会`	重複が削除された`Y`の要素のリスト。`一会`には,数値ベクトル,カテゴリカル変数のベクトル,逻辑ベクトル,文字配列,文字ベクトルの细胞配列のいずれかを指定できます。`一会`は，引数`Y`のデタと同じデタ型です。(字符串配列は文字ベクトルのcell配列として扱われます)。長さがkの次元が少なくとも1のプロパティの値に含まれている場合，`一会`ではその次元に沿って(`成本`や`之前`などの)要素の順序を指定します。
`ClassProbability`	`树`のノドのクラス確率を表すn行k列の配列。ここで，nはノド数，kはクラス数となります。任意のノド番号`我`に対して，クラス確率`ClassProbability(我,:)`は，ノド`我`の条件を満たすポ邮箱ントに対する各クラスの推定確率です。
`成本`	正方行列。`成本(i, j)`は真のクラスが`我`である点をクラス`j`に分類するコストです(行は真のクラス，列は予測したクラスに対応します)。`成本`の行と列の順序は，`一会`のクラスの順序に対応します。`成本`の行および列の数は，応答に含まれている一意なクラスの数です。このプロパティは読み取り専用です。
`CutCategories`	`树`の分岐で使用されたカテゴリを表すn行2列のcell配列。Nはノド数です。カテゴリカル予測子変数`x`に基づく各枝ノド`我`に対して，`x`が`CutCategories{1},我`内のカテゴリである場合は左側の子が選択され，`x`が`CutCategories{2},我`内のカテゴリである場合は右側の子が選択されます。連続予測子に基づく枝ノドと葉ノドに対する`CutCategories`の列は両方とも空です。 `割点`には`“连续”`切り取りの切り取り点が含まれ，`CutCategories`にはカテゴリセットが含まれます。
`割点`	`树`の切り取り点として使用される値を表す要素数nのベクトル。ここで，nはノド数です。連続予測子変数`x`に基づく各枝ノド`我`において，`x <割点(我)`の場合は左側の子が選択され，`x > =割点(我)`の場合は右側の子が選択されます。カテゴリカル予測子に基づく枝ノドと葉ノドに対する`割点`は`南`です。 `割点`には`“连续”`切り取りの切り取り点が含まれ，`CutCategories`にはカテゴリセットが含まれます。
`CutType`	`树`の各ノドの切り取りのタのcell配列。ここで，nはノド数です。各ノド`我`に対して`CutType{我}`は次のいずれかです。 `“连续”`——変数`x`と切り取り点`v`に対して，切り取りが`x < v`形式で定義されている場合。 `“分类”`——変数`x`がカテゴリセット内の値を受け取るかどうかによって切り取りが定義されている場合。 `”`- - - - - -`我`が葉ノドの場合。 `割点`には`“连续”`切り取りの切り取り点が含まれ，`CutCategories`にはカテゴリセットが含まれます。
`CutPredictor`	`树`の各ノドの分岐に使用された変数名を示す要素数nの单元配列。Nはノド数です。これらの変数は，“切り取り変数”と呼ばれることもあります。葉ノドの場合，`CutPredictor`には空の文字ベクトルが格納されます。 `割点`には`“连续”`切り取りの切り取り点が含まれ，`CutCategories`にはカテゴリセットが含まれます。
`CutPredictorIndex`	`树`の各ノドで分岐に使用される変数を対象とした，数値n要素配列。Nはノド数です。詳細は，`CutPredictor`を参照してください。
`ExpandedPredictorNames`	展開された予測子名。文字ベクトルのcell配列として格納されます。モデルがカテゴリカル変数用のエンコディングを使用している場合，`ExpandedPredictorNames`には展開された変数を表す名前が格納されます。それ以外の場合，`ExpandedPredictorNames`は`PredictorNames`と同じです。
`IsBranchNode`	N要素の逻辑ベクトルであり，`树`の各枝ノドの場合は`真正的`，各葉ノドの場合は`假`になります。
`NodeClass`	`树`の各ノドで最も確からしいクラスの名前とn要素の单元配列。ここでnはリのノド数を示します。この配列の各要素は，`一会`に含まれているクラス名のいずれかに等しい文字ベクトルです。
`NodeError`	`树`に含まれるノドの誤差のn要素のベクトル。ここで，nはノド数です。`NodeError(我)`は，ノド`我`の誤分類の確率です。
`NodeProbability`	`树`に含まれるノドの確率のn要素のベクトル。ここで，nはノド数です。ノドの確率は，ノタから，観測の比率として計算されます。この比率は，各クラスに割り当てられている前の確率に対して調整されます。
`NodeRisk`	リに含まれるノドのリスクを表すn要素のベクトル。ここで，nはノド数です。各ノドのリスクは、ノード確率で重みが付けられたこのノードの不純度の測定基準 (ジニ指数または逸脱度) です。ツリーが twoing によって成長した場合、各ノードのリスクはゼロです。
`NodeSize`	`树`に含まれるノドのサ。ここで，nはノド数です。ノードのサイズは,ノードの条件を満たすツリーを作成するために使用されるデータから,観測数として定義されます。
`NumNodes`	`树`のノド数。
`父`	`树`に含まれる各ノドの親ノドの数を含むn要素のベクトル。ここで，nは，ノド数です。ルトノドの親は`0`です。
`PredictorNames`	予測子変数の名前のcell配列。並びは`X`に現れる順です。
`之前`	各クラスの事前確率の数値ベクトル。`之前`の要素の順序は，`一会`のクラスの順序に対応します。`之前`の要素数は，応答に含まれている一意なクラスの数です。このプロパティは読み取り専用です。
`PruneAlpha`	枝刈りレベルごとに1の要素をも数値ベクトル。枝刈りレベルの範囲が0 ~ mの場合，`PruneAlpha`には昇順に並べ替えられたm + 1要素が含まれます。`PruneAlpha (1)`は枝刈りレベル0(枝刈りなし)を表し，`PruneAlpha (2)`は枝刈りレベル1を表すというように続いていきます。
`PruneList`	`树`の各ノドの枝刈りレベルをも。ここでnはノド数を示します。枝刈りレベルの範囲は0(枝刈りなし)からmです。Mは最下位の葉からルトノドまでの距離です。
`ResponseName`	応答変数`Y`を表す文字ベクトル。
`ScoreTransform`	スコア変換用の関数ハンドル，または組み込みの変換関数を表す文字ベクトル。`“没有”`は変換なしを意味します。等価的には，`“没有”`は`@ x (x)`です。組み込みの変換関数のリストとカスタム変換関数の構文は，`fitctree`を参照してください。ドット表記を使用して関数`ScoreTransform`を追加または変更します。 ctree。ScoreTransform = 'function'或ctree。ScoreTransform = @function
`SurrogateCutCategories`	`树`の代理分岐に使用するカテゴリのn要素のcell配列。ここでnは`树`のノド数です。各ノド`k`に対して，`SurrogateCutCategories {k}`はcell配列です。`SurrogateCutCategories {k}`の長さは，このノ。`SurrogateCutCategories {k}`の各要素は,連続代理予測子の場合は空の文字ベクトル,カテゴリカル代理予測子の場合はカテゴリをもつ2要素细胞配列になります。2要素 cell 配列の最初の要素には、この代理分岐によって左の子に割り当てられたカテゴリがリストされ、この 2 要素 cell 配列の 2 番目の要素には、この代理分岐によって右の子に割り当てられたカテゴリがリストされます。各ノードの代理分岐変数の順序は、`SurrogateCutVar`に存在する変数の順序に一致します。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合，`SurrogateCutCategories`には空のセルが含まれます。
`SurrogateCutFlip`	`树`の代理分岐に使用する数値切り取り点のn要素のcell配列。ここでnは`树`のノド数です。各ノド`k`に対して，`SurrSurrogateCutFlip {k}`は数値ベクトルです。`SurrogateCutFlip {k}`の長さは，このノ。`SurrogateCutFlip {k}`の各要素はカテゴリカル代理予測子でゼロになるか,連続代理予測子で数値切り取り点の割り当てになります。数値切り取り点の割り当ては，-1または+1のいずれかになります。連続予測子変数Zに基づく数値切り取り C が含まれるすべての代理分岐では、Z < Cであり，その代理分岐の切り取りの割り当てが+1である場合，またはZ≥Cであり，その代理分岐の切り取りの割り当てが-1である場合，左の子が選択されます。同様に，Z≥Cであり，その代理分岐の切り取り点割り当てが+1である場合，またはZ < Cであり，その代理分岐の切り取り点が-1である場合，右の子が選択されます。各ノドにおける代理分岐変数の順序は，`SurrogateCutPredictor`によって返される変数の順序に一致します。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合，`SurrogateCutFlip`には空の配列が含まれます。
`SurrogateCutPoint`	`树`の代理分岐に使用される数値のn要素のcell配列。ここでnは`树`のノド数です。各ノド`k`に対して，`SurrogateCutPoint {k}`は数値ベクトルです。`SurrogateCutPoint {k}`の長さは，このノ。`SurrogateCutPoint {k}`の各要素は，カテゴリカル代理予測子で`南`になるか，連続代理予測子で数値切り取り点になります。連続予測子変数Zに基づく数値切り取り C が含まれるすべての代理分岐では、Z < Cであり，その代理分岐の`SurrogateCutFlip`が+1である場合，またはz≥cであり，その代理分岐の`SurrogateCutFlip`が-1である場合，左の子が選択されます。同様に，Z≥Cであり，その代理分岐の`SurrogateCutFlip`が+1である場合，またはZ < Cであり，その代理分岐の`SurrogateCutFlip`が-1である場合，右の子が選択されます。各ノドの代理分岐変数の順序は，`SurrogateCutPredictor`によって返される変数の順序に一致します。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合，`SurrogateCutPoint`には空のセルが含まれます。
`SurrogateCutType`	`树`の各ノドの代理分岐のタ要素のcell配列。ここでnは`树`のノド数です。各ノドの`k`で,`SurrogateCutType {k}`はこのノドの代理分岐変数のタ。変数は,最適予測子との結びつきの予測尺度によって降順に並べ替えられており,かつ正の予測尺度をもつ変数のみが含まれています。各ノドにおける代理分岐変数の順序は，`SurrogateCutPredictor`によって返される変数の順序に一致します。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合，`SurrogateCutType`には空のセルが含まれます。代理分岐のタプは，切り取りが変数`Z`に対して`Z`<`V`の形式で定義されている場合は`“连续”`に，切り取りが`Z`がカテゴリのセットの値を取るかどうかによって定義されている場合は切り取り点`V`または`“分类”`のいずれかになります。
`SurrogateCutPredictor`	`树`の各ノドで代理分岐に使用する変数の名前のn要素の单元配列。ここでnは`树`のノド数です。`SurrogateCutPredictor`の各要素は，このノ细胞配列です。変数は,最適予測子との結びつきの予測尺度によって降順に並べ替えられており,かつ正の予測尺度をもつ変数のみが含まれています。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合，`SurrogateCutPredictor`には空のセルが含まれます。
`SurrogatePredictorAssociation`	`树`の代理分岐に使用する関連性予測尺度のn要素のcell配列。ここでnは`树`のノド数です。各ノド`k`に対して，`SurrogatePredictorAssociation {k}`は数値ベクトルです。`SurrogatePredictorAssociation {k}`の長さは，このノ。`SurrogatePredictorAssociation {k}`の各要素は，最適分割とこの代理分岐間の関連性予測尺度を与えます。各ノドの代理分岐変数の順序は，`SurrogateCutPredictor`に存在する変数の順序になります。このノドの最適分割変数は現れません。枝ではない(葉)ノドの場合，`SurrogatePredictorAssociation`には空のセルが含まれます。

オブジェクト関数

`compareHoldout`	新しいデタを使用して2の分類モデルの精度を比較
`边缘`	分類エッジ
`石灰`	局部可解释模型不可知解释(LIME)
`损失`	分類誤差
`保证金`	分類マジン
`partialDependence`	部分従属の計算
`plotPartialDependence`	部分依存プロット(pdp)および個別条件付き期待値(ice)プロットの作成
`预测`	分類木の使用によるラベルの予測
`predictorImportance`	分類木の予測子の重要度の推定
`沙普利`	シャプレ
`surrogateAssociation`	分類木における代理分岐に対する関連性の平均予測尺度
`更新`	コド生成用にモデルパラメタを更新
`视图`	分類木の表示

コピのセマンティクス

値。値のクラスがコピ操作に与える影響にいては，オブジェクトのコピを参照してください。

例

すべて折りたたむ

コンパクトな分類木の構築

ラ邮箱ブスクリプトを開く

フィッシャのアヤメのデタのコンパクトな分類木を構築します。

负载fisheriris树= fitctree(量、种类);ctree =紧凑(树);

生成された木のサ邮箱ズと元の木のサ邮箱ズを比較します。

t =谁(“树”）;% t.bytes =以字节为单位的树大小c =谁(“ctree”）;% c.bytes = ctree的大小，单位为字节[c。字节t.bytes]

ans =1×25097 11762

コンパクトな木は元の木より小さくなっています。

詳細

すべて展開する

不純度とノド誤差

決定木では，"不純度"または“ノド誤差”に基づいてノドを分割します。

不純度とは，SplitCriterion名前と値のペアの引数によって，次のいずれかの意味を表します。

ジニ多様性指数(gdi)—ノドのジニ指数は，次の式で表されます。

$1 - \sum_{我} p^{2} （我），$

ここで,合計はノードのクラス我全体が対象であり,p (i)はノードに到達したクラス我をもつ観測クラスの比率です。クラスを1だけもノド("純粋"ノド)のジニ指数は0です。それ以外のノドでは，ジニ指数は正の値です。したがって，ジニ指数はノドの不純度の基準です。
逸脱度 (“异常”) -ノドの逸脱度は，ジニ指数と同様に定義されたp(i)を用いて次の式で表されます。

$- \sum_{我} p （我） {日志}_{2} p （我）．$

純粋ノドの逸脱度は0です。それ以外のノドでは，逸脱度は正の値です。
Twoing規則(“两个”) - - -两个はノードの純粋度の基準ではありませんが,ノードの分割を判断するための別の基準の1つです.Lは(我),分割後の左側の子ノードのクラス我のメンバーの比率を示し,R (i)は分割後の右側の子ノードのクラス我のメンバーの比率を示すとします。最大化するための分割基準を選択します。

$P （ l ） P （ R ） {（ \sum_{我} | l （我） - R （我） | ）}^{2} ，$

ここで，p (l)およびp (r)は，それぞれ左側と右側に分割された観測値の比率を表します。式が大きい場合は，分割によって各子ノドの純粋度は高くなります。同様に，式が小さい場合は、分割によって各子ノードが互いに類似するようになります。このため、親ノードとも類似するようになります。分割によるノードの純粋度の向上はありませんでした。
ノド誤差—ノドで誤分類されたクラスの比率です。jがノードで最大の学習標本数をもつクラスである場合は、ノード誤差は次のように表されます。

1 - p (j)。

拡張機能

C/ c++コド生成
MATLAB®Coder™を使用してCおよびc++コドを生成します。

使用上の注意事項および制限事項:

関数预测および更新はコド生成をサポトします。
金宝app^®に分類木モデルの予測を統合するには,统计和机器学习工具箱™ライブラリにあるClassificationTree预测ブロックを使用するか，matlab^®命令功能ブロックを関数预测と共に使用します。
fitctreeを使用して分類木に学習をさせる場合，以下の制限が適用されます。
- 名前と値のペアの引数“ScoreTransform”の値を無名関数にすることはできません。固定小数点コドの生成では，“ScoreTransform”の値を“invlogit”にすることはできません。
- 代理分岐は使用できません。まり，名前と値のペアの引数“代孕”の値は“关闭”でなければなりません。
- 固定小数点コードの生成およびコーダーコンフィギュアラーを使用するコード生成では,以下の追加制限が適用されます。
  - カテゴリカル予測子(逻辑、分类、字符、字符串，または细胞)はサポトされません。名前と値の引数“CategoricalPredictors”は使用できません。カテゴリカル予測子をモデルに含めるには，モデルをあてはめる前にdummyvarを使用してカテゴリカル予測子を前処理します。
  - 分类デタ型のクラスラベルはサポトされません。学習デタ内のクラスラベル値(资源描述またはYおよび名前と値の引数“类名”の値はどらも分类デタ型の配列にはできません。

詳細は，コド生成の紹介を参照してください。

参考

ClassificationTree|fitctree|紧凑的|compareHoldout

R2011aで導入

CompactClassificationTree

説明

構築

入力引数

プロパティ

オブジェクト関数

コピのセマンティクス

例

コンパクトな分類木の構築

詳細

不純度とノド誤差

拡張機能

C/ c++コド生成
MATLAB®Coder™を使用してCおよびc++コドを生成します。

参考

统计和机器学习工具箱ドキュメンテション

サポト

機械学習をマスタする:matlabステップ·バ

CompactClassificationTree

説明

構築

入力引数

プロパティ

オブジェクト関数

コピのセマンティクス

例

コンパクトな分類木の構築

詳細

不純度とノド誤差

拡張機能

C/ c++コド生成MATLAB®Coder™を使用してCおよびc++コドを生成します。

参考

统计和机器学习工具箱ドキュメンテション

サポト

機械学習をマスタする:matlabステップ·バ

C/ c++コド生成
MATLAB®Coder™を使用してCおよびc++コドを生成します。