主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

部分竞争

说明

pd= partialDependence (RegressionMdlvar的)は,回帰モデルRegressionMdlを使用して,varに记载されているいる子数量间の分従属pdと予测応答を计算します。これには予测子データが含まれます。

pd= partialDependence (classificationmdl.var标签的)は,分享モデルclassificationmdl.を使用して,varに记载されているいる子数量间の分従属pdと,标签で指定されたクラスのスコアを計算します。これには予測子データが含まれます。

pd= partialDependence (___数据的)は,数据の新闻予测子データデータ使します。前前の构におけるにおけるいずれかの入引ののののわせわせ加入て数据を指定できます。

pd= partialDependence (___名称,价值的)は1つ以上の名前と値のペアの引数によって指定された追加オプションを使用します。たとえば,“UseParallel”,“真正的”を指定した場合,関数部分竞争は並列計算を使用して部分従属の計算を実行します。

[pdXy] =部分依存(___的)は,Xyも返します。これには,varの1番目と2番目の予測子変数の各クエリ点が含まれます。varで1つのの数を指定した合,部分竞争yに空行列([])を返します。

すべて折りたたむ

渔民データセットで単純ベイズ分類モデルに学習させて,予測子変数と複数クラスの予測スコア(事後確率)の関係を示す部分従属の値を計算します。

渔民データセットを読み込みます。これには150本のアヤメの標本について種類(物种)とがく片の長さ,がく片の幅,花弁の長さ,花弁の幅の測定値()が含まれています。このデータセットには,setosa,杂色的およびvirginicaの3種類のそれぞれについて50個ずつの標本が含まれています。

负载渔民

応答に物种,予測子にを使用して,単純ベイズ分類モデルに学習させます。

mdl = fitcnb(meas,speies,'predictornames', (“花萼长度”“萼片宽度”“花瓣长度”“花瓣宽度”]);

物种の3つのクラスすべてに対するMdlによる予測スコアについて,3番目の予測子変数(花弁の長さ)の部分従属の値を計算します。MdlClassnames.プロパティを使用して,クラスラベルを指定します。

(pd, x) = partialDependence (Mdl 3 Mdl.ClassNames);

pdにはクエリ点xの部分従属の値が含まれます。情节酒吧などのプロット関数を使用して,計算された部分従属の値をプロットできます。関数酒吧を使用して,Xに対してpdをプロットします。

Bar(x,pd)图例(mdl.classnames)xlabel(“花瓣长度”) ylabel (“分数”)标题(“部分依赖阴谋”的)

图中包含一个坐标轴。标题为Partial dependency Plot的坐标轴包含3个bar类型的对象。这些物品代表着维珍卡。

このモデルでは,virginicaの確率は花弁の長さにともなって増加しています。setosaの確率は,花弁の長さが0から2.5付近までは約0.33であり,それ以降は確率はほぼ0に低下します。

あるいは,関数plotPartialDependenceを使用し,部分従属の値を计算してプロットすることができます。

plotPartialDependence (Mdl 3 Mdl.ClassNames)

图中包含一个坐标轴。标题为“部分相关图”的轴包含3个类型为line的对象。这些物品代表着维珍卡。

分類モデルのアンサンブルに学習させ,複数クラスの2つの変数における部分従属の値を計算します。次に,各クラスの部分従属の値をプロットします。

人口普查1994.データセットを読み込みます。これには,< = 50 kまたは> 50 kに分類される米国の年収データと,複数の人口統計変数が含まれます。

负载人口普查1994.

分享到数量のサブセットをテーブルAdultData.から抽出します。

X = adultdata (1:50 0, {'年龄'“workClass”“education_num”“marital_status”“种族”...“性”'资本收益''capital_loss'“hours_per_week”'薪水'});

fitcensembleを使用して“方法”“包”として指定し,分享木のランダムフォレスト习习させせ再现再现性を得るためために,templateTree“复制”オプションで使用し,作成されたツリーのテンプレートを使用します。

rng ('默认') t = templateTree(“复制”,真正的);Mdl = fitcensemble (X,'薪水'“方法”“包”'学习者',t);

Mdlのクラス名を検査します。

mdl.classnames.
ANS =.2 x1分类< = 50 k > 50 k

両方のクラス(< = 50 k> 50 k)について,予测子年龄教育_NUM.のスコアの部分従属の値を计算します。抽出する観测値の个数を100に指定します。

[pd,x,y] = PartialDependence(MDL,{'年龄'“education_num”}, Mdl。ClassNames,“NumObservationsToSample”, 100);

関数SURFL.を使用し1番目のクラス(< = 50 k)の部分従属の値の表面プロットを作成します。

图冲浪(x, y,挤压(pd(1::)))包含('年龄') ylabel (“教育\ _num”)Zlabel('班级成绩<=50K')标题('部分依赖情节'30)视图([130])%修改视角

图中包含一个坐标轴。标题为“部分依赖关系图”的轴包含一个类型为surface的对象。

2番目のクラス(> 50 k)の部分従属の値の表面プロットを作成します。

图SURF(x,y,挤压(pd(2,::,:)))xlabel('年龄') ylabel (“教育\ _num”)Zlabel(' >班成绩50K')标题('部分依赖情节'30)视图([130])%修改视角

图中包含一个坐标轴。标题为“部分依赖关系图”的轴包含一个类型为surface的对象。

2つのプロットは,クラスによって异なる异なる分従属パターンパターン示します。

Carsmall.次モデル计算しのせ,2つのしし示す,各,2计算します示す,各をします示す,各,2计算计算ます示す,各,2つの计算ます示す,各,2,の计算ます示す,に,2,のします示す,に,2つのします示す,に,2,のし。を作物成します。

Carsmall.データセットを読み込みます。

负载Carsmall.

重量气缸位移马力を含む表を作成します。

台=表(重量、汽缸、排量、马力);

资源描述の予測子変数と応答変数英里/加仑を使用してSVM回帰モデルに学習させます。自動カーネルスケールのガウスカーネル関数を使用します。

mdl = fitrsvm(tbl,mpg,'responsebame''mpg'...'patericalpricictors'“气缸”“标准化”,真的,...'骨箱'“高斯”“KernelScale”'汽车');

予測子変数重量马力の予測応答(英里/加仑)の部分従属を計算します。クエリ点を指定し,名前と値のペアの引数“QueryPoints”を使用して部分従属を计算します。

numPoints = 10;ptX = linspace (min(重量),max(重量),numPoints) ';企业= linspace (min(马力),max(马力),numPoints) ';[pd,x,y] = PartialDependence(MDL,{“重量”“马力”},“QueryPoints”, (ptX企业]);

5行5列のタイル表示チャートレイアウトを含む图を作成します。関数显示亮度图像を使用して2つの変数の部分従属をプロットします。次に,関数柱状图。

t = tiledlayout (5 5“TileSpacing”'袖珍的');AX1 = NELTTILE(2,[4,4]);ImagesC(x,y,pd)标题('部分依赖情节') colorbar ('eastoutside')ax1.ydir =“正常”;ax2 = nexttile(22日[1,4]);dX = diff (ptX (1:2));edgeX = [ptX-dX / 2; ptX(结束)+ dX);直方图(重量,edgeX);包含(“重量”)XLIM(AX1.XLIM);AX3 = NELTTILE(1,[4,1]);dy = diff(pty(1:2));edgey = [pty-dy / 2; pty(end)+ dy];直方图(马力,eddy)Xlabel(“马力”)XLIM(AX1.YLIM);AX3.xdir =“反向”;Camroll(-90)

图包含3个轴。具有标题部分依赖图的轴1包含类型图像的对象。轴2包含类型直方图的对象。轴3包含类型直方图的对象。

pdの各要素は,イメージプロットの1ピクセルの色を指定します。イメージの座標軸に合わせたヒストグラムは,予測子の分布を示します。

入力引数

すべて折りたたむ

回帰モデル。完全またはコンパクトな回帰モデルオブジェクトとして指定します。サポートされるモデルは次の表に記載されています。

モデル 完全またはコンパクトなモデルオブジェクト
一般化線形モデル GeneralizedLinearModelCompactGeneralizedLinearModel
一般化線形混合効果モデル GeneralizedLinearMixedModel
線形回帰 LinearModelCompactLinearModel
線形混合効果モデル linearmixedmodel.
非非回帰 NonLinearModel
回帰モデルのアンサンブル RegressionEnsemble回归释迦缩短CompactRegressionEnsemble
一般化加法モデル(GAM) RegressionGAMCompactRegressionGAM
ガウス過程回帰 RegressionGPCompactRegressionGP
ランダムな特徴量拡張を使用したガウスカーネル回帰モデル 回归科内尔
高次元データの線形回帰 回归线性
ニューラルネットワーク回帰モデル RegressionNeuralNetworkcompactregressionneuralnetwork
サポートベクターマシン(SVM)回帰 RegressionSVMCompactRegressionSVM
回帰木 RegressionTreecompactregressiontree.
決定木のアンサンブルのバギング TreeBaggerCompactTreeBagger.

RegressionMdlが予測子データを含まないモデルオブジェクト(コンパクトなモデルなど)である場合,入力引数数据を指定しなければなりません。

部分竞争は,スパース行列で学习せたモデルオブジェクトをサポートませんんんんませませませませませませ値は非スパース数码またはまたは非スパース资料

分别完全またはまたはコンパクトなオブジェクトとしてされるモデルは次表に记载モデルは次いに记载モデルはれいい指定またはしし完全指定ししコンパクト完全し指定ししし指定しししししししししししししししししししししししししししししししししし指定またはまたはまたはまたはまたはまたはまたはまたはまたはまたは完全またはまたはまたはまたは完全完全

モデル 完全またはコンパクトなモデルオブジェクト
判別分析分類器 ClassificationDiscriminantCompactClassificationDiscriminant.
サポートベクターマシンまたはその他の分類器用のマルチクラスモデル ClassificationECOCCompactClassificationECOC
分享用のアンサンブル学仪器 ClassificationEnsembleCompactClassificationEnsembleClassificationBaggedEnsemble
一般化加法モデル(GAM) ClassificationGAMCompactClassificagegam.
ランダムな特徴量拡張を使用したガウスカーネル分類モデル ClassificationKernel
k最近傍分類器 ClassificationKNN
線形分類モデル 分类线性
マルチクラス単纯ベイズモデル ClassificationNaiveBayesCompactClassificationNaiveBayes
ニューラルネットワーク分類器 ClassificationNeuralNetworkCompactClassificationNeuralNetwork
1クラスおよびバイナリ分类用のベクターベクター(SVM)分类器 ClassificationSVMCompactClassificationSVM
マルチクラス分類用の二分決定木 ClassificationTreeCompactClassificationTree.
决定木のバギングアンサンブル TreeBaggerCompactTreeBagger.

classificationmdl.が予測子データを含まないモデルオブジェクト(コンパクトなモデルなど)である場合,入力引数数据を指定しなければなりません。

部分竞争は,スパース行列で学习せたモデルオブジェクトをサポートませんんんんませませませませませませ値は非スパース数码またはまたは非スパース资料

予測子変数。正の数のベクトル、文字ベクトル、string スカラー、string 配列、または文字ベクトルの cell 配列として指定します。次の表に示されているように、1 つまたは 2 つの予測子変数を指定できます。

1つの予測子変数

说明
正の数 予測子データの列に対応するインデックス値。
文章ベクトルまたは字符串スカラー

予測子変数の名前。名前はRegressionMdl。PredictorNamesまたはClassificationMdl。PredictorNamesのエントリに一致しなければなりません。

2つの予測子変数

说明
正の数量が2つ含まれているベクトル 予測子データの列に対応するインデックス値。
文字ベクトルの细胞配列または字符串配列

予測子変数の名前。配列の各要素は予測子変数の名前です。名前はRegressionMdl。PredictorNamesまたはClassificationMdl。PredictorNamesのエントリに一致しなければなりません。

例:{x1, x3的}

データ型:||字符|字符串|细胞

クラスクラス.Categorical配列,文章配列,逻辑ベクトル,数码ベクトル,または文ベクトルの细胞配列を指定ます。标签の値とデータ型は,classificationmdl.Classnames.プロパティ(ClassificationMdl。Classnames.)のクラス名のものと一致しなければなりません。

1つまたは复数のクラスを指定指定ます。

この引数は,classificationmdl.が分類モデルオブジェクトである場合のみ有効です。

例:{“红”、“蓝”}

例:ClassificationMdl。3类名([1])は,classificationmdl.の1番目と3番目のクラスとして标签を指定します。

データ型:||逻辑|字符|细胞|分类

予测子データ。数値行列またはテーブルとして指定します。数据の各行は1つの観测値に対応し,各列は1つの変数に対応します。

数据は,Xまたは变量プロパティに格納されている,モデル(RegressionMdlまたはclassificationmdl.)の学習に使用した予測子データと一致しなければなりません。

  • 数値行列を使用してモデルに学習をさせた場合,数据は数値行列でなければなりません。数据の列を構成する変数の個数と順序は,モデルに学習をさせた予測子変数のものと同じでなければなりません。

  • 表(たとえば资源描述)を使使使しモデルにに习をさせたた合书,数据は表でなければなりません。数据内のすべての予測子変数は,変数名およびデータ型が资源描述ののものと同じでなければなりませませただし,数据の列の順序が资源描述の列の順序に対応する必要はありません。

  • 部分竞争はスパース行列をサポートしません。

RegressionMdlまたはclassificationmdl.が予測子データを含まないモデルオブジェクトである場合,数据を指定しなければなりません。モデルが予測子データを含む完全なモデル オブジェクトである場合にこの引数を指定すると、部分竞争はモデルの予測子データを使用せず,数据のみを使用します。

データ型:||表格

名前と値のペアの引数

オプションの名称,价值引数のコンマ区切りペアを指定します。的名字は引数名で,价值は対応する値です。的名字は引用符で囲まなければなりません。Name1, Value1,…,的家のように,复数の名前とのペアののを,任意の顺番で指定でき。

例:PartialDependence(MDL,var,数据,'numobservationstosample',100,'deveralpallelallel',true)は,数据100年から抽出した個の観測値を使用し,ループの反复を并列実行することにより,部分従属の値を计算します。

部分従属の計算に,一般化加法モデル(GAM)の交互作用項を含めるフラグ。真正的またはとして指定します。この引数は,GAM の場合のみ有効です。つまり、この引数を指定できるのは、RegressionMdlRegressionGAMまたはCompactRegressionGAMである場合か,classificationmdl.ClassificationGAMまたはCompactClassificagegam.である場合だけです。

モデルに交互作用項が含まれる場合,'internalinteraction'の既定値は真正的です。モデルに交互作用項が含まれない場合,値はでなければなりません。

例:“IncludeInteractions”,假的

データ型:逻辑

部従属モデルモデル(gam)のいういういういういういういういういういうフラグいういういういういういういういういういうといういういういういういういういういういういういういういういういういう真正的またはとして指定します。この引数は,GAM の場合のみ有効です。つまり、この引数を指定できるのは、RegressionMdlRegressionGAMまたはCompactRegressionGAMである場合か,classificationmdl.ClassificationGAMまたはCompactClassificagegam.である場合だけです。

例:“IncludeIntercept”,假的

データ型:逻辑

抽出する観測値の個数。正の数として指定します。既定値は、数据またはモデル(RegressionMdlまたはclassificationmdl.)内の観测値値の。部分竞争はすべての観測値を使用します。

部分竞争は,関数datasampleを使用して観測値を非復元抽出し,抽出した観測値を部分従属の計算に使用します。

例:“NumObservationsToSample”,100年

データ型:|

数値予測子の部分従属を計算する点。数量列ベクトル那2列の数値行列、または 2 つの数値列ベクトルの cell 配列として指定します。

  • var内の予测子数量を1つ选択する场合,数码列ベクトルベクトル使使。

  • var内の予測子変数を2つ選択する場合,次のようにします。

    • 各予測子変数について同じ個数の点を指定するには,2列の数値行列を使用します。

    • 各予予子変について异なるのははは,2つの数据列ベクトルからるる配列使使。

既定値は,数码列ベクトルまたは2列の数码行列,选択した予测子数目のに応じてて决まり决まり各列するには决まり决まりににする抽出した観测値値の抽出した観测値の最値と最最値间隔空间隔并ぶぶぶぶぶれれますます。

カテゴリカル変数の“QueryPoints”关はできできませ。关联部分竞争では,選択した変数としてすべてカテゴリカル値を使用します。

1つの数値変数と1つのカテゴリカル変数を選択した場合,数値列ベクトルと空の配列で構成される细胞配列を使用することにより,数値変数について“QueryPoints”を指定できます。

例:QueryPoints, {pt, []}

データ型:||细胞

並列実行のフラグ。真正的またはとして指定します。“UseParallel”,真的を指定した場合,関数部分竞争は各観測値の応答またはスコアの予測と平均化を行う際,parを使用してループループの反复を并列并列実しますオプションには并行计算工具箱™が必要です。

例:“UseParallel”,真的

データ型:逻辑

出力数

すべて折りたたむ

部分従属の値。numXnumY列の数値行列(回帰モデル用)またはnumLabelsXnumXXnumY数値配列(分類モデル用)として返されます。numXnumYはそれぞれ,varの1つ目つ目2numLabels标签のクラスラベルの数。

pd (i, j, k)の値は,一世番目のクラスラベルにおけるクエリ点X(j)y(k)のの分従属のです。X(j)は1つ目の予測子変数におけるj番目のクエリ点で,y(k)は2つ目の予測子変数におけるK.番目のクエリ点です。

varの1つ目の予測子変数のクエリ点。数量列ベクトルまたは分类列ベクトルとして返されます。

予測子変数が数値の場合,名前と値のペアの引数“QueryPoints”の使用してクエリ点を指定できます。

データ型:||分类

varの2つ目の予测子変の点。数据値ベクトルまたは分类

予測子変数が数値の場合,名前と値のペアの引数“QueryPoints”の使用してクエリ点を指定できます。

データ型:||分类

详细

すべて折りたたむ

回帰モデルのの分従属

部分従属[1]は,学習済みの回帰モデルにおける予測子変数と予測応答の関係を表します。部分竞争は,他の変数を除外することにより,予測子変数のサブセットにおける予測応答の部分従属を計算します。

予测子仪分数繁体の合x = {x1, X2, …, XM.}のサブセットXS.サブセットx。サブセットxS.には1つまたは2つの変数が含まれます(XS.= {x.S1}またはXS.= {x.S1, XS2})。XCはXにおけるXS.の補集合であるとします。予測応答f (X)は,X内のすべての変数に依存します。

f (X) = f (XS., XC).

XS.に対する予測応答の部分従属は,XCに関する予測応答の期待値によって定義されます。

F S. X S. 的) = E. C [ F X S. X C 的) ] = F X S. X C 的) P. C X C 的) D. X C

ここで,pC(XC)はXCつまりの周辺确率确率つまり, P. C X C 的) P. X S. X C 的) D. X S. です。各観测値の确率が同程度,応答におけるxS.とX.Cの間の従属およびXS.とX.C部分竞争

F S. X S. 的) 1 N. σ. 一世 = 1 N. F X S. X 一世 C 的) (1)

ここここ,nは観测値の数,X一世X = (一世S., X一世C的)は我番目の観測値です。

関数部分竞争を呼び出す場合,入力引数RegressionMdlvarを使用して,学習済みモデル(f(·))の指定と変数(XS.)の選択をそれぞれ行うことができます。部分竞争は,X.S.からの100个の空间隔点,または名前と値ペアペア幂“QueryPoints”でで指定されたた点における部従属従属をしししの子データからする値値値个个个个“NumObservationsToSample”をを用して指定できます。

部分従属分類モデル

分類モデルの場合,部分竞争は,回帰回帰モデルと同じ同じでで部従属を计算しますます1违う点とし,关键词标签で指定されたクラスの予測スコアを使用します。

重み付き走查アルゴリズム

重み付き走查アルゴリズム[1]は,木木ベースののモデルの従属従属を推定するする従属従属推定される部従属従属ははの走查时にに到した叶ノードに対応対応する応答スコアの値重重重均均

XS.は変数全体の集合Xのサブセット,XCはXにおけるXS.の补结合であるであるとししししでで,この部アルゴリズムで,部分従属を计算するxS.の各値について,ルート(開始)ノードから葉(終端)ノードに向かって木を走査し,葉ノードの重みを求めます。走査は,ルートノードに1という重みの値を割り当てることにより始まります。XS.でノードが分割される場合,XS.の値に応じて適切な子ノードが走査されます。子ノードの重みは親ノードと同じになります。XCでノードが分类さされる合,両方向子ノードが走查れますは各子ノード重みは,各子ノードにする観测値比率亲ノード亲ノード値にし値になります。の完了后,割り当てられた重みを使用して加重平均が计算されます。

バギング木のアンサンブルの場合,推定される部分従属は,各木の加重平均の平均です。

アルゴリズム

部分竞争は,関数预测を使用して応答またはスコアを予測します。部分竞争は,モデル(RegressionMdlまたはclassificationmdl.)に従って適切な関数预测を選択し,既定の設定で预测を実行します。各関数预测の詳細については,次の2つの表の関数预测を参照してください。指定したモデルが木ベースのモデル(木のブースティングアンサンブルを除く)の場合,部分竞争は関数预测ではなく重み付き走查アルゴリズムををます。详细详细について,重み付き走查アルゴリズムを参照してください。

回帰モデルオブジェクト

モデルタイプ 完全またはコンパクトな回帰モデルオブジェクト 応答を予测する关联
決定木のアンサンブルのバギング CompactTreeBagger. 预测
決定木のアンサンブルのバギング TreeBagger 预测
回帰モデルのアンサンブル RegressionEnsemble回归释迦缩短CompactRegressionEnsemble 预测
ランダムな特徴量拡張を使用したガウスカーネル回帰モデル 回归科内尔 预测
ガウス過程回帰 RegressionGPCompactRegressionGP 预测
一般化加法モデル RegressionGAMCompactRegressionGAM 预测
一般化線形混合効果モデル GeneralizedLinearMixedModel 预测
一般化線形モデル GeneralizedLinearModelCompactGeneralizedLinearModel 预测
線形混合効果モデル linearmixedmodel. 预测
線形回帰 LinearModelCompactLinearModel 预测
高次元データの線形回帰 回归线性 预测
ニューラルネットワーク回帰モデル RegressionNeuralNetworkcompactregressionneuralnetwork 预测
非非回帰 NonLinearModel 预测
回帰木 RegressionTreecompactregressiontree. 预测
サポートベクターマシン RegressionSVMCompactRegressionSVM 预测

分類モデルオブジェクト

モデルタイプ 完全またはコンパクトな分類モデルオブジェクト ラベルとスコアを予测する关联
判別分析分類器 ClassificationDiscriminantCompactClassificationDiscriminant. 预测
サポートベクターマシンまたはその他の分類器用のマルチクラスモデル ClassificationECOCCompactClassificationECOC 预测
分享用のアンサンブル学仪器 ClassificationEnsembleCompactClassificationEnsembleClassificationBaggedEnsemble 预测
ランダムな特徴量拡張を使用したガウスカーネル分類モデル ClassificationKernel 预测
一般化加法モデル ClassificationGAMCompactClassificagegam. 预测
k最近最近傍 ClassificationKNN 预测
線形分類モデル 分类线性 预测
単純ベイズモデル ClassificationNaiveBayesCompactClassificationNaiveBayes 预测
ニューラルネットワーク分類器 ClassificationNeuralNetworkCompactClassificationNeuralNetwork 预测
1クラスおよびバイナリ分享用ののベクター ClassificationSVMCompactClassificationSVM 预测
マルチクラス分類用の二分決定木 ClassificationTreeCompactClassificationTree. 预测
决定木のバギングアンサンブル TreeBaggerCompactTreeBagger. 预测

代替機能

参照

[1]弗里德曼,杰罗姆。贪婪函数近似:梯度增压机《统计年鉴》第29期5(2001): 1189 - 1232。

[2] Hastie,Trevor,Robert Tibshirani和Jerome Friedman。统计学习的要素。纽约,纽约:春天纽约,2009年。

拡張機能

R2020bで導入