ClassificationLinearクラス

高次元データのバイナリ分類用の線形モデル

説明

ClassificationLinearは,バイナリ分類用の学習済み線形モデルオブジェクトです。この線形モデルは,サポートベクターマシン(SVM)またはロジスティック回帰モデルです。fitclinearは,高次元データセットの計算時間を短縮する手法(確率的勾配降下法など)を使用して目的関数を最小化することによりClassificationLinearモデルをあてはめます。分類損失と正則化項を加算することにより目的関数が構成されます。

他の分類モデルと異なり,メモリ消費を節約するため,ClassificationLinearモデルオブジェクトには学習データが格納されません。ただし,推定した線形モデル係数,事前クラス確率,正則化強度などは格納されます。

学習済みのClassificationLinearモデルを使用して,新しいデータの分類スコアまたはラベルを予測できます。詳細については,预测を参照してください。

構築

ClassificationLinearオブジェクトの作成にはfitclinearを使用します。

プロパティ

すべて展開する

線形分類のプロパティ

`λ`- - - - - -正則化項の強度
非負のスカラー|非負値のベクトル。

正則化項の強度。非負のスカラーまたは非負値のベクトルを指定します。

データ型:双|单

`学习者`- - - - - -線形分類モデルのタイプ
`“物流”`|`“支持向量机”`

線形分類モデルのタイプ。“物流”または“支持向量机”を指定します。

次の表では, $f （ x ）＝ x β + b ．$ です。

βはp個の係数のベクトルです。
xはp個の予測子変数による観測値です。
bはスカラーバイアスです。

値	アルゴリズム	損失関数	`FittedLoss`の値
`“物流”`	ロジスティック回帰	逸脱度(ロジスティック): $ℓ ［ y ， f （ x ）］＝日志｛ 1 + 经验值［ - y f （ x ）］｝$	`分对数的`
`“支持向量机”`	サポートベクターマシン	ヒンジ: $ℓ ［ y ， f （ x ）］＝马克斯［ 0 ， 1 - y f （ x ）］$	`“枢纽”`

`β`- - - - - -線形係数の推定値
数値ベクトル

線形係数の推定値。長さが予測子数に等しい数値ベクトルを指定します。

データ型:双

`偏见`- - - - - -推定バイアス項
数値スカラー

推定バイアス項またはモデルの切片。数値スカラーを指定します。

データ型:双

`FittedLoss`- - - - - -線形モデルのあてはめに使用する損失関数
`“枢纽”`|`分对数的`

このプロパティは読み取り専用です。

線形モデルのあてはめに使用する損失関数。“枢纽”または分对数的を指定します。

値	アルゴリズム	損失関数	`学习者`の値
`“枢纽”`	サポートベクターマシン	ヒンジ: $ℓ ［ y ， f （ x ）］＝马克斯［ 0 ， 1 - y f （ x ）］$	`“支持向量机”`
`分对数的`	ロジスティック回帰	逸脱度(ロジスティック): $ℓ ［ y ， f （ x ）］＝日志｛ 1 + 经验值［ - y f （ x ）］｝$	`“物流”`

`正则化`- - - - - -複雑度ペナルティのタイプ
`“套索(L1)”`|`“岭(L2)”`

複雑度ペナルティのタイプ。“套索(L1)”または“岭(L2)”を指定します。

最小化のための目的関数は,平均損失関数(FittedLossを参照)と次の表の正則化値を加算することにより作成されます。

値	説明
`“套索(L1)”`	套索(l₁)ペナルティ: $λ \sum_{j ＝ 1}^{p} \| β_{j} \|$
`“岭(L2)”`	リッジ(l₂)ペナルティ: $\frac{λ}{2} \sum_{j ＝ 1}^{p} β_{j}^{2}$

λは,正則化項の強度を規定します(λを参照)。

バイアス項(β₀)は正則化ペナルティから除外されます。

他の分類のプロパティ

`CategoricalPredictors`- - - - - -カテゴリカル予測子のインデックス
正の整数のベクトル|`［］`

カテゴリカル予測子のインデックス。正の整数のベクトルとして指定します。予測子データの行に観測値が含まれていると仮定すると、CategoricalPredictorsには,カテゴリカル予測子が含まれている予測子データの列に対応するインデックス値が格納されます。どの予測子もカテゴリカルではない場合,このプロパティは空(［］)になります。

データ型:单|双

`一会`- - - - - -一意のクラスラベル
绝对配列|文字配列|逻辑ベクトル|数値ベクトル|文字ベクトルの细胞配列

学習で使用する一意なクラスラベル。绝对配列、文字配列、逻辑ベクトル、数値ベクトル,または文字ベクトルの细胞配列を指定します。一会のデータ型はクラスラベルYと同じです。(字符串配列は文字ベクトルの细胞配列として扱われます)。一会はクラスの順序も決定します。

データ型:分类|字符|逻辑|单|双|细胞

`成本`- - - - - -誤分類のコスト
正方数値行列

このプロパティは読み取り専用です。

誤分類のコスト。正方数値行列として指定します。成本にはK個の行および列が含まれ,Kはクラスの数です。

成本(我，j）は,真のクラスが我である点をクラスjに分類するコストです。成本の行と列の順序は,一会のクラスの順序に対応します。

データ型:双

`ModelParameters`- - - - - -モデルに学習をさせるために使用されたパラメーター
構造体

ClassificationLinearモデルに学習をさせるために使用したパラメーター。構造体を指定します。

ModelParametersのフィールドにはドット表記でアクセスします。たとえば,線形係数およびバイアス項の相対許容誤差にアクセスするにはMdl.ModelParameters.BetaToleranceを使用します。

データ型:结构体

`PredictorNames`- - - - - -予測子名
文字ベクトルの细胞配列

予測子データに現れる順序で並んでいる予測子名。文字ベクトルの细胞配列として指定します。PredictorNamesの長さは,予測子変数として使用される学習データXまたは资源描述に含まれている変数の数と等しくなります。

データ型:细胞

`ExpandedPredictorNames`- - - - - -展開された予測子名
文字ベクトルの细胞配列

展開された予測子名。文字ベクトルの cell 配列を指定します。

モデルがカテゴリカル変数用のエンコーディングを使用している場合,ExpandedPredictorNamesには展開された変数を表す名前が格納されます。それ以外の場合,ExpandedPredictorNamesはPredictorNamesと同じです。

データ型:细胞

`之前`- - - - - -前のクラスの確率
数値ベクトル

このプロパティは読み取り専用です。

前のクラスの確率。数値ベクトルとして指定します。之前には,一会のクラスと同数の要素があり,その順序は一会の要素と一致します。

データ型:双

`ResponseName`- - - - - -応答変数名
文字ベクトル

応答変数名。文字ベクトルを指定します。

データ型:字符

`ScoreTransform`- - - - - -スコア変換関数
`“doublelogit”`|`“invlogit”`|`“ismax”`|`分对数的`|`“没有”`|関数ハンドル|……

予測されたスコアに適用するスコア変換関数。関数名または関数ハンドルを指定します。

線形分類モデルで変換前の場合,観測値x(行ベクトル)について予測される分類スコアはF (x) = xβ + bになります。βとbはそれぞれMdl。βとMdl。偏见に対応します。

スコア変換関数を函数などに変更するには,ドット表記を使用します。

組み込み関数の場合,函数を表の値に置き換えて次のコードを入力します。

Mdl。ScoreTransform =“函数”;

値	説明
`“doublelogit”`	1 / (1 + e^{2 x}）
`“invlogit”`	Log (x / (1 - x))
`“ismax”`	最大のスコアをもつクラスのスコアを1に設定し,他のすべてのクラスのスコアを0に設定する
`分对数的`	1 / (1 + e^{- x}）
`“没有”`または`“身份”`	x(変換なし)
`“标志”`	x < 0のとき1 x = 0のとき0 x > 0のとき1
`“对称”`	2 x - 1
`“symmetricismax”`	最大のスコアをもつクラスのスコアを1に設定し,他のすべてのクラスのスコアを1に設定する
`“symmetriclogit”`	2 / (1 + e^{- x}) - 1

MATLAB^®関数やユーザー定義関数の場合は,関数ハンドルを入力します。
```
Mdl。ScoreTransform = @function;
```
函数は,各クラスの元のスコアの行列を受け入れて,各クラスの変換後のスコアを表す同じサイズの行列を返さなければなりません。

データ型:字符|function_handle

オブジェクト関数

`边缘`	線形分類モデルの分類エッジ
`incrementalLearner`	バイナリ分類用の線形モデルをインクリメンタル学習器に変換
`石灰`	本地可解释模型不可知解释(LIME)
`损失`	線形分類モデルの分類損失
`保证金`	線形分類モデルの分類マージン
`partialDependence`	部分従属の計算
`plotPartialDependence`	部分依存プロット(PDP)および個別条件付き期待値(ICE)プロットの作成
`预测`	線形分類モデルのラベルの予測
`沙普利`	シャープレイ値
`selectModels`	正則化されたバイナリ線形分類モデルのサブセットの選択
`更新`	コード生成用にモデルパラメーターを更新

コピーのセマンティクス

値。値のクラスがコピー操作に与える影響については、オブジェクトのコピーを参照してください。

例

すべて折りたたむ

線形分類モデルの学習

ライブスクリプトを開く

サポートベクターマシン,双対SGDおよびリッジ正則化を使用して,バイナリ線形分類モデルに学習をさせます。

NLPのデータセットを読み込みます。

负载nlpdata

Xは予測子データのスパース行列,Yはクラスラベルの直言ベクトルです。データには2つを超えるクラスがあります。

统计和机器学习工具箱™のドキュメンテーションWebページに対応するラベルを特定します。

Ystats = Y ==“统计数据”；

あるドキュメンテーションWebページの単語数が统计和机器学习工具箱™ドキュメンテーションによるものであるかどうかを識別できるバイナリ線形分類モデルに学習をさせます。データセット全体を使用してモデルに学習をさせます。近似の要約を抽出して,最適化アルゴリズムによるモデルがどの程度データにあてはまるかを判断します。

rng (1);%的再现性[Mdl, FitInfo] = fitclinear (X, Ystats)

Mdl = classficationlinear ResponseName: 'Y' ClassNames: [0 1] ScoreTransform: 'none' Beta: [34023x1 double] Bias: -1.0059 Lambda: 3.1674e-05 Learner: 'svm'属性，方法

FitInfo =结构体字段:Lambda: 3.1674e-05 Objective: 5.3783e-04 PassLimit: 10 NumPasses: 10 BatchLimit: [] NumIterations: 238561 GradientNorm: NaN GradientTolerance: 0 RelativeChangeInBeta: 0.0562 BetaTolerance: 1.0000e-04 DeltaGradient: 1.4582 DeltaGradientTolerance: 1 TerminationCode: 0 TerminationStatus:{'迭代限制超过。Alpha: [31572x1 double] History: [] FitTime: 0.1290 Solver: {'dual'}

MdlはClassificationLinearモデルです。Mdlと学習データまたは新しいデータを损失に渡して,標本内分類誤差を調べることができます。または,Mdlと新しい予測子データを预测に渡して,新しい観測値のクラスラベルを予測することができます。

FitInfoは,重要な情報として終了ステータス(TerminationStatus)とソルバーによるモデルのデータへのあてはめにかかった時間(FitTime)が含まれている構造体配列です。FitInfoを使用して,最適化終了時の結果が満足できるものであるかどうかを判断することをお勧めします。モデルの再学習を試すこともできますが,学習時間は短いので,データを通す回数を増やしてください。このようにすると,DeltaGradientなどの尺度が向上します。

線形分類モデルの使用によるクラスラベルの予測

ライブスクリプトを開く

NLPのデータセットを読み込みます。

负载nlpdatan =大小(X, 1);%观测次数

统计和机器学习工具箱™のドキュメンテーションWebページに対応するラベルを特定します。

Ystats = Y ==“统计数据”；

5%のデータをホールドアウトします。

rng (1);%的再现性本量利= cvpartition (n,“坚持”, 0.05)

nummobations: 31572 NumTestSets: 1 TrainSize: 29994 TestSize: 1578

本量利は,n個のデータを学習セットと検定セットに無作為に分割する方法を定義するCVPartitionオブジェクトです。

あるドキュメンテーションWebページの単語数が统计和机器学习工具箱™ドキュメンテーションによるものであるかどうかを識別できる学習セットを使用して,バイナリ線形分類モデルに学習をさせます。学習時間を短縮するため,観測値が列単位になるように予測子データの行列を配置します。

idxTrain =培训(cvp);%提取训练集指标X = X ';Mdl = fitclinear (X (:, idxTrain) Ystats (idxTrain),“ObservationsIn”，“列”）;

ホールドアウト標本の観測値と分類誤差を予測します。

idxTest =测试(cvp);%提取测试集指标标签=预测(Mdl X (:, idxTest),“ObservationsIn”，“列”）;L =损失(Mdl X (:, idxTest) Ystats (idxTest),“ObservationsIn”，“列”）

L = 7.1753 e-04

Mdlが誤分類する標本外観測値は1%未満です。

拡張機能

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。

使用上の注意事項および制限事項:

関数预测および更新はコード生成をサポートします。
fitclinearを使用して線形分類モデルに学習をさせる場合,以下の制限が適用されます。
- 予測子データの入力引数値は,行列である場合,非スパースの数値行列でなければなりません。コード生成ではスパースデータがサポートされません。
- 正則化強度は1つしか指定できず,“汽车”または名前と値のペアの引数“λ”に非負のスカラーを指定します。
- 名前と値のペアの引数“ScoreTransform”の値を無名関数にすることはできません。
- コーダーコンフィギュアラーを使用するコード生成では,以下の追加制限が適用されます。
  - カテゴリカル予測子(逻辑、分类、字符、字符串,または细胞)はサポートされません。名前と値の引数“CategoricalPredictors”は使用できません。カテゴリカル予測子をモデルに含めるには,モデルをあてはめる前にdummyvarを使用してカテゴリカル予測子を前処理します。
  - 分类データ型のクラスラベルはサポートされません。学習データ内のクラスラベル値(资源描述またはY)および名前と値の引数“类名”の値はどちらも分类データ型の配列にはできません。

詳細は,コード生成の紹介を参照してください。

参考

R2016aで導入

ClassificationLinearクラス

説明

構築

プロパティ

`λ`- - - - - -正則化項の強度
非負のスカラー|非負値のベクトル。

`学习者`- - - - - -線形分類モデルのタイプ
`“物流”`|`“支持向量机”`

`β`- - - - - -線形係数の推定値
数値ベクトル

`偏见`- - - - - -推定バイアス項
数値スカラー

`FittedLoss`- - - - - -線形モデルのあてはめに使用する損失関数
`“枢纽”`|`分对数的`

`正则化`- - - - - -複雑度ペナルティのタイプ
`“套索(L1)”`|`“岭(L2)”`

`CategoricalPredictors`- - - - - -カテゴリカル予測子のインデックス
正の整数のベクトル|`［］`

`一会`- - - - - -一意のクラスラベル
绝对配列|文字配列|逻辑ベクトル|数値ベクトル|文字ベクトルの细胞配列

`成本`- - - - - -誤分類のコスト
正方数値行列

`ModelParameters`- - - - - -モデルに学習をさせるために使用されたパラメーター
構造体

`PredictorNames`- - - - - -予測子名
文字ベクトルの细胞配列

`ExpandedPredictorNames`- - - - - -展開された予測子名
文字ベクトルの细胞配列

`之前`- - - - - -前のクラスの確率
数値ベクトル

`ResponseName`- - - - - -応答変数名
文字ベクトル

`ScoreTransform`- - - - - -スコア変換関数
`“doublelogit”`|`“invlogit”`|`“ismax”`|`分对数的`|`“没有”`|関数ハンドル|……

オブジェクト関数

コピーのセマンティクス

例

線形分類モデルの学習

線形分類モデルの使用によるクラスラベルの予測

拡張機能

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。

参考

统计和机器学习工具箱ドキュメンテーション

サポート

機械学習をマスターする:MATLABステップ・バイ・ステップガイド

ClassificationLinearクラス

説明

構築

プロパティ

λ- - - - - -正則化項の強度非負のスカラー|非負値のベクトル。

学习者- - - - - -線形分類モデルのタイプ“物流”|“支持向量机”

β- - - - - -線形係数の推定値数値ベクトル

偏见- - - - - -推定バイアス項数値スカラー

FittedLoss- - - - - -線形モデルのあてはめに使用する損失関数“枢纽”|分对数的

正则化- - - - - -複雑度ペナルティのタイプ“套索(L1)”|“岭(L2)”

CategoricalPredictors- - - - - -カテゴリカル予測子のインデックス正の整数のベクトル|［］

一会- - - - - -一意のクラスラベル绝对配列|文字配列|逻辑ベクトル|数値ベクトル|文字ベクトルの细胞配列

成本- - - - - -誤分類のコスト正方数値行列

ModelParameters- - - - - -モデルに学習をさせるために使用されたパラメーター構造体

PredictorNames- - - - - -予測子名文字ベクトルの细胞配列

ExpandedPredictorNames- - - - - -展開された予測子名文字ベクトルの细胞配列

之前- - - - - -前のクラスの確率数値ベクトル

ResponseName- - - - - -応答変数名文字ベクトル

ScoreTransform- - - - - -スコア変換関数“doublelogit”|“invlogit”|“ismax”|分对数的|“没有”|関数ハンドル|……

オブジェクト関数

コピーのセマンティクス

例

線形分類モデルの学習

線形分類モデルの使用によるクラスラベルの予測

拡張機能

C / c++コード生成MATLAB®编码器™を使用してCおよびc++コードを生成します。

参考

统计和机器学习工具箱ドキュメンテーション

サポート

機械学習をマスターする:MATLABステップ・バイ・ステップガイド

`λ`- - - - - -正則化項の強度
非負のスカラー|非負値のベクトル。

`学习者`- - - - - -線形分類モデルのタイプ
`“物流”`|`“支持向量机”`

`β`- - - - - -線形係数の推定値
数値ベクトル

`偏见`- - - - - -推定バイアス項
数値スカラー

`FittedLoss`- - - - - -線形モデルのあてはめに使用する損失関数
`“枢纽”`|`分对数的`

`正则化`- - - - - -複雑度ペナルティのタイプ
`“套索(L1)”`|`“岭(L2)”`

`CategoricalPredictors`- - - - - -カテゴリカル予測子のインデックス
正の整数のベクトル|`［］`

`一会`- - - - - -一意のクラスラベル
绝对配列|文字配列|逻辑ベクトル|数値ベクトル|文字ベクトルの细胞配列

`成本`- - - - - -誤分類のコスト
正方数値行列

`ModelParameters`- - - - - -モデルに学習をさせるために使用されたパラメーター
構造体

`PredictorNames`- - - - - -予測子名
文字ベクトルの细胞配列

`ExpandedPredictorNames`- - - - - -展開された予測子名
文字ベクトルの细胞配列

`之前`- - - - - -前のクラスの確率
数値ベクトル

`ResponseName`- - - - - -応答変数名
文字ベクトル

`ScoreTransform`- - - - - -スコア変換関数
`“doublelogit”`|`“invlogit”`|`“ismax”`|`分对数的`|`“没有”`|関数ハンドル|……

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。