plotDiagnostics

绘制线性回归模型的观察诊断图

折叠所有页面

语法

plotDiagnostics (mdl)

plottype plotDiagnostics (mdl)

plotDiagnostics (mdl plottype、名称、值)

h = plotDiagnostics (＿＿＿）

描述

plotDiagnostics创建一个观察诊断图，如杠杆、库克距离，并删除-1统计数据，以确定异常值和有影响的观察结果。

例子

plotDiagnostics (mdl）创建线性回归模型的杠杆图(mdl)观察。图中的虚线表示推荐的阈值。

plotDiagnostics (mdl,plottype）观察诊断的类型plottype．

plotDiagnostics (mdl,plottype,名称,值）使用一个或多个名称-值对参数指定诊断数据点的图形属性。例如，您可以为数据点指定标记符号和大小。

h= plotDiagnostics (＿＿＿）使用前面语法中的任意输入参数组合返回绘图中的线或轮廓的图形对象。使用h在创建绘图后修改特定线或轮廓的属性。有关属性列表，请参见行属性和轮廓属性．

例子

全部折叠

利用杠杆和库克距离发现异常值

打开生活的脚本

绘制杠杆值和库克的观察距离，并找出异常值。

加载carsmall数据集和拟合的线性回归模型的里程作为一个函数的模型年，重量，和重量的平方。

负载carsmall台=表(MPG、重量);资源描述。年=分类(Model_Year);mdl = fitlm(资源描述,'MPG ~年+重量^2'）；

绘制杠杆值。

plotDiagnostics (mdl)传说(“显示”）%显示图例

图中包含一个坐标轴。杠杆的Case order plot的标题轴包含2个line类型的对象。这些对象表示杠杆、参考线。

虚线表示建议阈值2*p/n,在那里p是系数的个数，和n为观察次数。方法查找阈值NumCoefficients和NumObservations属性。

t_leverage = 2 * mdl.NumCoefficients / mdl.NumObservations

t_leverage = 0.1064

查找杠杆值超过阈值的观察值。

找到(mdl.Diagnostics。利用> t_leverage)

ans =3×126日32 35

您还可以使用数据提示找到一个观察数字。选择阈值线以上的数据点以显示它们的数据提示。数据提示包括x设在和y所选点的-axis值，以及观测数。

绘制库克的距离值。

plotDiagnostics (mdl“cookd”）

图中包含一个坐标轴。库克距离的Case order plot标题轴包含2个line类型的对象。这些物体代表库克距离，参考线。

虚线表示建议阈值。计算阈值t_cookd．

t_cookd = 3 *意味着(mdl.Diagnostics.CooksDistance,“omitnan”）

t_cookd = 0.0320

找出库克距离值超过阈值的观察值。

找到(mdl.Diagnostics。CooksDistance > t_cookd)

ans =6×126 35 80 90 92 97

两个观察值(26和35)在两种测量方法中都是异常值，但一些点(32、80、90、92和97)仅在一种测量方法中是异常值。

输入参数

全部折叠

`mdl`- - - - - -线性回归模型
`LinearModel`对象

线性回归模型，指定为LinearModel对象创建使用fitlm或stepwiselm．

`plottype`- - - - - -类型的情节
`“杠杆”`(默认)|`“轮廓”`|`“cookd”`|`“covratio”`|`“dfbetas”`|`“dffits”`|`“s2_i”`

plot的类型，指定为该表中的一个值。

价值	情节类型	图中的虚线参考线	目的
`“轮廓”`	剩余vs. Cook距离重叠轮廓的杠杆	库克距离的轮廓	识别具有大剩余值、高杠杆和大库克距离值的观察结果。
`“cookd”`	库克的距离	建议阈值，由`3 *意味着(mdl.Diagnostics.CooksDistance)`	用较大的库克距离值识别观察结果。
`“covratio”`	减去-1协方差行列式之比	建议阈值，由`1±3 * p / n`,在那里`p`为系数个数(`mdl。NumCoefficients`),`n`为观测次数(`mdl。NumObservations`）	当delete-1统计值不在建议阈值范围内时，识别观察值。
`“dfbetas”`	在系数估计中删除-1缩放差异	建议阈值，由`3 /√(n)`	识别具有大删除-1统计值的观测值。
`“dffits”`	删除-1比例差异的拟合值	建议阈值，由`2 *倍根号(p / n)`用绝对值表示	在绝对值中识别具有大删除-1统计值的观测值。
`“杠杆”`	利用	建议阈值，由`2 * p / n`	确定高杠杆观察。
`“s2_i”`	Delete-1方差	均方误差(`mdl。均方误差`）	将删除-1方差与均方误差进行比较。

对于所有情节类型，除了“轮廓”,x-axis是观察值的行号(大小写顺序)。

的诊断的属性mdl包含所使用的诊断值plotDiagnostics创建块。

有关观察诊断的详细信息，请参见库克的距离,Delete-1统计,利用．

名称-值对的观点

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家．

例子:“颜色”、“蓝”、“标记”,“o”

请注意

这里列出的图形属性只是一个子集。有关完整列表，请参见行属性．指定的属性决定诊断数据点的外观。

`“颜色”`- - - - - -线颜色
RGB值|十六进制颜色代码|颜色名称|短名称

行颜色，指定为逗号分隔对，由“颜色”和RGB三元组、十六进制颜色代码、颜色名称或下表中列出的颜色选项的简短名称。

的“颜色”名称-值对参数还确定标记轮廓颜色和标记填充颜色“MarkerEdgeColor”是“汽车”(默认),“MarkerFaceColor”是“汽车”．

对于自定义颜色，指定RGB三元组或十六进制颜色代码。

RGB三元组是一个由三个元素组成的行向量，其元素指定颜色的红色、绿色和蓝色组件的强度。强度必须在这个范围内[0, 1]；例如,(0.4 0.6 0.7)．
十六进制颜色代码是以哈希符号开头的字符向量或字符串标量(＃)，然后是3个或6个十六进制数字，其范围可以是0来F．这些值不区分大小写。因此，颜色是代码“# FF8800”,“# ff8800”,“# F80”,“# f80”是等价的。

或者，您可以通过名称指定一些常见的颜色。该表列出了已命名的颜色选项、等价的RGB三联体和十六进制颜色代码。

颜色名称	短名称	RGB值	十六进制颜色代码	外观
`“红色”`	`“r”`	`(1 0 0)`	`“# FF0000”`
`“绿色”`	`‘g’`	`(0 1 0)`	`“# 00 ff00”`
`“蓝”`	`“b”`	`(0 0 1)`	`“# 0000 ff”`
`“青色”`	`“c”`	`(0 1 1)`	`“# 00飞行符”`
`“红色”`	`“米”`	`(1 0 1)`	`“#就”`
`“黄色”`	`“y”`	`(1 1 0)`	`“# FFFF00”`
`“黑”`	`“k”`	`(0 0 0)`	`# 000000的`
`“白色”`	`' w '`	`(1 1 1)`	`“# FFFFFF”`
`“没有”`	不适用	不适用	不适用	没有颜色

这里是RGB三联体和十六进制颜色代码的默认颜色MATLAB^®用于许多类型的情节。

RGB值	十六进制颜色代码	外观
`[0 0.4470 - 0.7410)`	`“# 0072 bd”`
`(0.8500 0.3250 0.0980)`	`“# D95319”`
`(0.9290 0.6940 0.1250)`	`“# EDB120”`
`(0.4940 0.1840 0.5560)`	`“# 7 e2f8e”`
`(0.4660 0.6740 0.1880)`	`“# 77 ac30”`
`(0.3010 0.7450 0.9330)`	`“# 4 dbeee”`
`(0.6350 0.0780 0.1840)`	`“# A2142F”`

例子:“颜色”、“蓝”

`“线宽”`- - - - - -线宽
积极的价值

行宽，指定为逗号分隔对，由“线宽”分数是正的。如果线有标记，那么线的宽度也会影响标记的边缘。

例子:“线宽”,0.75

`“标记”`- - - - - -标记符号
`“o”`|`“+”`|`‘*’`|`“。”`|`“x”`|……

标记符号，指定为逗号分隔对，由“标记”和这个表中的一个值。

价值	描述
`“o”`	圆
`“+”`	加号
`‘*’`	星号
`“。”`	点
`“x”`	交叉
`“_”`	水平线
`“\|”`	垂直的线
`“广场”`或`“年代”`	广场
`“钻石”`或`' d '`	钻石
`“^”`	Upward-pointing三角形
`“v”`	向下的三角形
`“>”`	三点三角形
`“<”`	只左向三角形
`五角星形的`或`“p”`	五角星(五角星形)
`“卦”`或`“h”`	六芒星(六)
`“没有”`	没有标记

例子:“标记”,“+”

`“MarkerEdgeColor”`- - - - - -大纲标志颜色
`“汽车”`(默认)|`“没有”`|RGB值|十六进制颜色代码|颜色名称|短名称

标记轮廓颜色，指定为逗号分隔对组成“MarkerEdgeColor”和RGB三元组、十六进制颜色代码、颜色名称或其中一种颜色选项的简短名称颜色名称-值对的论点。

的默认值“汽车”使用由using指定的相同颜色“颜色”．

例子:“MarkerEdgeColor”、“蓝”

`“MarkerFaceColor”`- - - - - -标记填充颜色
`“没有”`(默认)|`“汽车”`|RGB值|十六进制颜色代码|颜色名称|短名称

标记填充颜色，指定为逗号分隔对组成“MarkerFaceColor”和RGB三元组、十六进制颜色代码、颜色名称或其中一种颜色选项的简短名称颜色名称-值对的论点。

的“汽车”值使用由using指定的相同颜色“颜色”．

例子:“MarkerFaceColor”、“蓝”

`“MarkerSize”`- - - - - -标志尺寸
`6`(默认)|积极的价值

标记大小，指定为逗号分隔对，由“MarkerSize”分数是正的。

例子:“MarkerSize”,2

输出参数

全部折叠

`h`——图形对象
图形阵列

与绘图中的线或轮廓相对应的图形对象，作为图形数组返回。使用点表示法查询和设置图形对象的属性。有关详细信息,请参见行属性和轮廓属性．

可以使用名称-值对参数指定与第一个图形对象对应的诊断数据点的外观h (1)．如果plottype是“dfbetas”，图中每个系数都有一个直线对象。名称-值对参数指定所有系数的行对象属性。您可以使用相应的图形对象分别修改每个系数的属性。

提示

数据游标在数据提示(位于数据点旁边的小文本框)中显示所选绘图点的值。数据提示包括x设在和y所选点的-axis值，以及观测名称或数字。
使用传奇(显示)来显示预填充的图例。

选择功能

一个LinearModel对象提供多个绘图函数。
- 在创建模型时，使用plotAdded了解添加或删除预测变量的影响。
- 当验证模型时，使用plotDiagnostics找到有问题的数据，并理解每个观察的效果。此外,使用plotResiduals分析模型的残差。
- 拟合模型后使用plotAdjustedResponse,plotPartialDependence,plotEffects来了解一个特定预测器的影响。使用plotInteraction了解两个预测因子之间的相互作用。此外,使用plotSlice通过预测面绘制切片。

参考文献

Neter, J.， M. H. Kutner, C. J. Nachtsheim, W. Wasserman。应用线性统计模型,第四版。芝加哥:麦格劳-希尔·欧文，1996。

扩展功能

GPU数组
使用并行计算工具箱™在图形处理单元(GPU)上运行加速代码。

使用注意事项及限制:

这个函数支持带有GPU阵列输金宝app入参数的模型对象。

有关更多信息，请参见在GPU上运行MATLAB函数(并行计算工具箱)．

另请参阅

LinearModel|plotResiduals

主题

介绍了R2012a

plotDiagnostics

语法

描述

例子

利用杠杆和库克距离发现异常值

输入参数

`mdl`- - - - - -线性回归模型
`LinearModel`对象

`plottype`- - - - - -类型的情节
`“杠杆”`(默认)|`“轮廓”`|`“cookd”`|`“covratio”`|`“dfbetas”`|`“dffits”`|`“s2_i”`

名称-值对的观点

`“颜色”`- - - - - -线颜色
RGB值|十六进制颜色代码|颜色名称|短名称

`“线宽”`- - - - - -线宽
积极的价值

`“标记”`- - - - - -标记符号
`“o”`|`“+”`|`‘*’`|`“。”`|`“x”`|……

`“MarkerEdgeColor”`- - - - - -大纲标志颜色
`“汽车”`(默认)|`“没有”`|RGB值|十六进制颜色代码|颜色名称|短名称

`“MarkerFaceColor”`- - - - - -标记填充颜色
`“没有”`(默认)|`“汽车”`|RGB值|十六进制颜色代码|颜色名称|短名称

`“MarkerSize”`- - - - - -标志尺寸
`6`(默认)|积极的价值

输出参数

`h`——图形对象
图形阵列

更多关于

库克的距离

Delete-1统计

利用

提示

选择功能

参考文献

扩展功能

GPU数组
使用并行计算工具箱™在图形处理单元(GPU)上运行加速代码。

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一步一步的指导与MATLAB

plotDiagnostics

语法

描述

例子

利用杠杆和库克距离发现异常值

输入参数

mdl- - - - - -线性回归模型LinearModel对象

plottype- - - - - -类型的情节“杠杆”(默认)|“轮廓”|“cookd”|“covratio”|“dfbetas”|“dffits”|“s2_i”

名称-值对的观点

“颜色”- - - - - -线颜色RGB值|十六进制颜色代码|颜色名称|短名称

“线宽”- - - - - -线宽积极的价值

“标记”- - - - - -标记符号“o”|“+”|‘*’|“。”|“x”|……

“MarkerEdgeColor”- - - - - -大纲标志颜色“汽车”(默认)|“没有”|RGB值|十六进制颜色代码|颜色名称|短名称

“MarkerFaceColor”- - - - - -标记填充颜色“没有”(默认)|“汽车”|RGB值|十六进制颜色代码|颜色名称|短名称

“MarkerSize”- - - - - -标志尺寸6(默认)|积极的价值

输出参数

h——图形对象图形阵列

更多关于

库克的距离

Delete-1统计

利用

提示

选择功能

参考文献

扩展功能

GPU数组使用并行计算工具箱™在图形处理单元(GPU)上运行加速代码。

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一步一步的指导与MATLAB

`mdl`- - - - - -线性回归模型
`LinearModel`对象

`plottype`- - - - - -类型的情节
`“杠杆”`(默认)|`“轮廓”`|`“cookd”`|`“covratio”`|`“dfbetas”`|`“dffits”`|`“s2_i”`

`“颜色”`- - - - - -线颜色
RGB值|十六进制颜色代码|颜色名称|短名称

`“线宽”`- - - - - -线宽
积极的价值

`“标记”`- - - - - -标记符号
`“o”`|`“+”`|`‘*’`|`“。”`|`“x”`|……

`“MarkerEdgeColor”`- - - - - -大纲标志颜色
`“汽车”`(默认)|`“没有”`|RGB值|十六进制颜色代码|颜色名称|短名称

`“MarkerFaceColor”`- - - - - -标记填充颜色
`“没有”`(默认)|`“汽车”`|RGB值|十六进制颜色代码|颜色名称|短名称

`“MarkerSize”`- - - - - -标志尺寸
`6`(默认)|积极的价值

`h`——图形对象
图形阵列

GPU数组
使用并行计算工具箱™在图形处理单元(GPU)上运行加速代码。