このペ,ジの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。
plotDiagnostics
線形回帰モデルの観測値の診断情報をプロット
構文
説明
plotDiagnostics
は,影響力が大きい観測値および外れ値を識別するための,観測値の診断情報(てこ比,クックの距離,1標本を取り除いたときの統計量(Delete-1統計量)など)のプロットを作成します。
例
てこ比とクックの距離の使用による外れ値の検出
観測値のてこ比の値とクックの距離をプロットして,外れ値を検出します。
carsmall
データセットを読み込み,モデル年,重量,および重量の二乗の関数として,燃費の線形回帰モデルをあてはめます。
负载carsmalltbl = table(MPG,Weight);资源描述。Year = categorical(Model_Year);MDL = fitlm(tbl,MPG ~年+重量^2);
てこ比値をプロットします。
plotDiagnostics (mdl)传说(“显示”)%显示图例
点線は,推奨されるしきい値2*p/nを表します。pは係数の数,nは観測値の数です。NumCoefficients
およびNumObservations
プロパティを使用して,しきい値を求めます。
t_leverage = 2* mll . numcoefficients / mll . numobservations
T_leverage = 0.1064
てこ比の値がしきい値を超えている観測値を検出します。
找到(mdl.Diagnostics。杠杆> t_leverage)
ans =3×126 32 35
デ,タヒントを使用して観測値の番号を確認することもできます。しきい値のラインより上にあるデータ点を選択すると、データ ヒントが表示されます。データ ヒントには、選択した点のx軸およびy軸の値と,観測値の番号が含まれます。
クックの距離の値をプロットします。
plotDiagnostics (mdl“cookd”)
点線は,推奨されるしきい値を表します。しきい値t_cookd
を計算します。
t_cookd = 3*mean(mld . diagnostics . cooksdistance,“omitnan”)
T_cookd = 0.0320
クックの距離の値がしきい値を超えている観測値を検出します。
找到(mdl.Diagnostics。> t_cookd)
ans =6×126 35 80 90 92 97
2つの観測値(26および35)は両方の尺度で外れ値です,がいくつかの点(80、90、92および97)は一方の尺度のみで外れ値です。
入力引数
mdl
- - - - - -線形回帰モデル
LinearModel
オブジェクト
線形回帰モデル。fitlm
またはstepwiselm
を使用して作成したLinearModel
オブジェクトとして指定します。
plottype
- - - - - -プロットのタ@ @プ
“杠杆”
(既定値) |“轮廓”
|“cookd”
|“covratio”
|“dfbetas”
|“dffits”
|“s2_i”
プロットのタ@ @プ。次の表のいずれかの値を指定します。
値 | プロットタ@ @プ | プロット内の点線の基準線 | 目的 |
---|---|---|---|
“轮廓” |
クックの距離の等高線を重ね合わせた,残差対てこ比 | クックの距離の等高線 | 残差,てこ比およびクックの距離の値が大きい観測値を特定。 |
“cookd” |
クックの距離 | 3 *意味着(mdl.Diagnostics.CooksDistance) によって計算された,推奨されるしきい値 |
クックの距離の値が大きい観測値を特定。 |
“covratio” |
共分散の行列式の删除-1比 | 1±3 * p / n によって計算された,推奨されるしきい値。p は係数の個数(mdl。NumCoefficients )、n は観測値の個数(mdl。NumObservations ) |
推奨されるしきい値の範囲に删除-1統計量の値が含まれない観測値を特定。 |
“dfbetas” |
係数推定値のスケリングされた删除-1差分 | 3 /√(n) によって計算された,推奨されるしきい値 |
删除-1統計量の値が大きい観測値を特定。 |
“dffits” |
近似値のスケリングされた删除-1差分 | 2 *倍根号(p / n) によって絶対値で計算された,推奨されるしきい値 |
删除-1統計量の絶対値が大きい観測値を特定。 |
“杠杆” |
てこ比 | 2 * p / n によって計算された,推奨されるしきい値 |
てこ比が大きい観測値を特定。 |
“s2_i” |
1標本を取り除いたときの分散 | 平均二乗誤差 (mdl。均方误差 ) |
删除-1分散と平均二乗誤差を比較。 |
“轮廓”
を除くすべてのプロットタプで,x軸は観測値の行番号(ケス順)です。
mdl
の诊断
プロパティには,plotDiagnostics
がプロットの作成に使用した診断値が格納されます。
観測値の診断情報の詳細にいては,クックの距離、1標本を取り除いたときの統計およびてこ比を参照してください。
名前と値の引数
例:“颜色”、“蓝”、“标记”,“o”
オプションの名称,值
引数のコンマ区切りペアを指定します。名字
は引数名で,价值
は対応する値です。名字
は引用符で囲まなければなりません。Name1, Value1,…,的家
のように,複数の名前と値のペアの引数を,任意の順番で指定できます。
メモ
ここでは,グラフィックプロパティの一部だけを紹介しています。完全な一覧にいては,热线のプロパティを参照してください。指定したプロパティによって,診断デ,タ点の外観が決まります。
颜色
- - - - - -ラ@ @ンの色
RGB 3成分|16進数のカラコド|色の名前|省略名
ラ@ @ンの色。“颜色”
とRGB 3成分,16進数のカラーコード,または,以下の表に記載されているいずれかの色オプションに対応する色の名前または省略名から構成されるコンマ区切りのペアとして指定します。
“MarkerEdgeColor”
が“汽车”
(既定)であり“MarkerFaceColor”
が“汽车”
である場合,名前と値のペアの引数“颜色”
はマカの輪郭の色とマカの塗りぶし色も決定します。
カスタム色の場合は,rgb 3成分または16進数のカラコドを指定します。
RGB 3成分は,色の赤,緑,青成分の強度を指定する3要素の行ベクトルです。強度は範囲
[0, 1]
に含まれていなければなりません。たとえば[0.4 0.6 0.7]
のようになります。16進数のカラ、コ、ドは、ハッシュ記号(
#
)で始まり,0
からF
の範囲にある16進数が3つまたは6つ続く,文字ベクトルまたは字符串スカラーです。この値では,大文字と小文字は区別されません。したがって,カラ,コ,ド“# FF8800”
、“# ff8800”
、“# F80”
、“# f80”
は等価です。
あるいは,一部の一般的な色を名前で指定できます。次の表は,名前が付いた色のオプション,等価なRGB 3成分,および16進数のカラーコードの一覧です。
色の名前 | 省略名 | RGB 3成分 | 16進数のカラコド | 外観 |
---|---|---|---|---|
“红色” |
“r” |
[10 0 0] |
“# FF0000” |
|
“绿色” |
‘g’ |
[0 10 0] |
“# 00 ff00” |
|
“蓝” |
“b” |
[0 0 1] |
“# 0000 ff” |
|
“青色” |
“c” |
[0 1 1] |
“# 00飞行符” |
|
“红色” |
“米” |
[10 0 1] |
“#就” |
|
“黄色” |
“y” |
[11 10 0] |
“# FFFF00” |
|
“黑” |
“k” |
[0 0 0] |
# 000000的 |
|
“白色” |
' w ' |
[1 1 1] |
“# FFFFFF” |
|
“没有” |
該当なし | 該当なし | 該当なし | 色なし |
以下は,matlab®が多くのタイプのプロットで使用する既定の色に対するRGB 3成分および16進数のカラーコードです。
RGB 3成分 | 16進数のカラコド | 外観 |
---|---|---|
[0 0.4470 0.7410] |
“# 0072 bd” |
|
[0.8500 0.3250 0.0980] |
“# D95319” |
|
[0.9290 0.6940 0.1250] |
“# EDB120” |
|
[0.4940 0.1840 0.5560] |
“# 7 e2f8e” |
|
[0.4660 0.6740 0.1880] |
“# 77 ac30” |
|
[0.3010 0.7450 0.9330] |
“# 4 dbeee” |
|
[0.6350 0.0780 0.1840] |
“# A2142F” |
|
例:“颜色”、“蓝”
线宽
- - - - - -ラ@ @ンの幅
正の値
ラ@ @ンの幅。“线宽”
と正の値(ポaapl .ント単位)から構成されるコンマ区切りのペアとして指定します。ランにマカがある場合,ラン幅はマカエッジにも影響を与えます。
例:“线宽”,0.75
标记
- - - - - -マ,カ,記号
“o”
|“+”
|‘*’
|“。”
|“x”
|……
マ,カ,記号。“标记”
と次の表のいずれかの値から構成されるコンマ区切りのペアとして指定します。
マカ | 説明 | 結果として得られるマカ |
---|---|---|
“o” |
円 |
|
“+” |
プラス記号 |
|
‘*’ |
アスタリスク |
|
“。” |
点 |
|
“x” |
十字 |
|
“_” |
水平線 |
|
“|” |
垂直線 |
|
“年代” |
正方形 |
|
' d ' |
菱形 |
|
“^” |
上向き三角形 |
|
“v” |
下向き三角形 |
|
“>” |
右向き三角形 |
|
“<” |
左向き三角形 |
|
“p” |
星形五角形 |
|
“h” |
星形六角形 |
|
“没有” |
マ,カ,なし | 該当なし |
例:“标记”,“+”
MarkerEdgeColor
- - - - - -マ,カ,の輪郭の色
“汽车”
(既定値) |“没有”
|RGB 3成分|16進数のカラコド|色の名前|省略名
マ,カ,の輪郭の色。“MarkerEdgeColor”
とRGB 3成分,16進数のカラコド,または,名前と値のペアの引数颜色
に記載されているいずれかの色オプションに対応する色の名前または省略名から構成されるコンマ区切りのペアとして指定します。
既定値“汽车”
では,“颜色”
を使用して指定されるものと同じ色が使用されます。
例:“MarkerEdgeColor”、“蓝”
MarkerFaceColor
- - - - - -マカの塗りぶし色
“没有”
(既定値) |“汽车”
|RGB 3成分|16進数のカラコド|色の名前|省略名
マカの塗りぶし色。“MarkerFaceColor”
とRGB 3成分,16進数のカラコド,または,名前と値のペアの引数颜色
に記載されているいずれかの色オプションに対応する色の名前または省略名から構成されるコンマ区切りのペアとして指定します。
値“汽车”
では,“颜色”
を使用して指定されるものと同じ色が使用されます。
例:“MarkerFaceColor”、“蓝”
MarkerSize
- - - - - -マカサズ
6
(既定値) |正の値
マカサズ。“MarkerSize”
と正の値(ポaapl .ント単位)から構成されるコンマ区切りのペアとして指定します。
例:“MarkerSize”,2
出力引数
h
-グラフィックスオブジェクト
グラフィックス配列
プロット内のラ@ @ンまたは等高線に対応するグラフィックスオブジェクト。グラフィックス配列として返されます。グラフィックスオブジェクトのプロパティのクエリと設定を行うには,ドット表記を使用します。詳細にいては,热线のプロパティおよび轮廓のプロパティを参照してください。
名前と値のペアの引数を使用して,1番目のグラフィックスオブジェクトh (1)
に対応する,診断デ,タ点の外観を指定できます。plottype
が“dfbetas”
である場合,各係数に対応する行オブジェクトがプロットに含まれます。名前と値のペアの引数は,すべての係数の行オブジェクトのプロパティを指定します。対応するグラフィックスオブジェクトを使用して,各係数のプロパティを個別に修正できます。
詳細
クックの距離
クックの距離は近似値におけるスケーリングされた変化であり,Xの値(予測子変数に対する観測値)から外れ値を特定する場合に便利です。クックの距離は,近似応答値に対する各観測値の影響を示します。平均のクックの距離の3倍を超える観測は外れ値の可能性があります。
クックの距離dの各要素は,観測値の削除による近似応答値の変化を正規化した値です。観測値我のクックの距離は次のようになります。
ここで
は,j番目の近似応答値です。
は,i番目の観測値を除いて近似したj番目の応答値です。
Mseは,平均二乗誤差です。
Pは回帰モデルの係数の数です。
クックの距離は代数的には次の式と等価です。
ここでr我はI番目の残差,h2は我番目のてこ比値です。
詳細は,クックの距離を参照してください。
1標本を取り除いたときの統計
1標本を取り除いたときの統計量(Delete-1統計量)は,各観測値の影響を特定するために便利です。これらの統計量は,各観測値を順番にあてはめから除外することによって生じる変化を取得します。すべての観測値を使用するモデルとDelete-1統計量が大きく異なる場合,その観測値には大きい影響力があります。
删除-1統計量の定義と使用法にいては,1標本を取り除いたときの統計を参照してください。
てこ比
てこ比は,入力空間で特定の観測の位置が原因で発生した,回帰予測におけるその観測値の影響を測定します。
観測値iのてこ比はハット行列Hのi番目の対角項H2の値です。ハット行列hは,デ,タ行列xに関して次のように定義されます。
H = x (xTX)1XT.
ハット行列は“射影行列”とも呼ばれます。これは,観測値のベクトルyを予測値のベクトル に射影するので“ハット”がyの上に置かれるためです。
てこ比値の合計はp(回帰モデルの係数の個数)なので,てこ比がp / n (nは観測値の個数)を大幅に超える場合,観測値我は外れ値であると考えることができます。
詳細は,ハット行列とてこ比を参照してください。
ヒント
データカーソルを使用すると,選択したプロットの点の値がデータヒント(データ点の横にある小さいテキストボックス)に表示されます。デ,タヒントには,選択した点のx軸およびy軸の値と,観測値の名前または番号が含まれます。
事前設定済みの凡例を表示するには,
传奇(显示)
を使用します。
代替機能
LinearModel
オブジェクトには,複数のプロット関数が用意されています。モデルを作成するときに,予測子変数の追加または削除による効果を理解するには,
plotAdded
を使用します。モデルを検証するときに,問題があるデ,タを探し,各観測値の効果を理解するには,
plotDiagnostics
を使用します。また,モデルの残差を分析するには,plotResiduals
を使用します。モデルをあてはめた後で,特定の予測子の効果を理解するには,
plotAdjustedResponse
、plotPartialDependence
およびplotEffects
を使用します。2つの予測子の間の交互作用効果を理解するには、plotInteraction
を使用します。また,予測曲面を通るスラplotSlice
を使用します。
参照
[1]内特,J., M. H.库特纳,C. J.纳赫茨海姆和W.沃瑟曼。应用线性统计模型,第四版。芝加哥:McGraw-Hill Irwin, 1996。
拡張機能
Gpu配列
并行计算工具箱™を使用してグラフィックス処理装置(GPU)上で実行することにより,コードを高速化します。
使用上の注意事項および制限事項:
この関数は,gpu配列の入力引数を使ってあてはめられたモデルオブジェクトをサポ,トします。
詳細は,Gpuでのmatlab関数の実行(并行计算工具箱)を参照してください。
バ,ジョン履歴
Matlabコマンド
次のmatlabコマンドに対応するリンクがクリックされました。
コマンドをmatlabコマンドウィンドウに入力して実行してください。Webブラウザ,はMATLABコマンドをサポ,トしていません。
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。