主要内容

清除异常数据

在Live Editor中查找、填充或删除异常值

描述

这个清除异常数据任务让您交互式地处理数据中的异常值。任务自动生成MATLAB®为您的实时脚本编写代码。

使用此任务,您可以:

  • 从工作区变量中的数据中查找、填充或删除异常值。

  • 自定义查找和填充离群值的方法。

  • 自动可视化异常数据和清除的数据。

打开任务

添加清除异常数据在MATLAB编辑器中将任务添加到实时脚本:

  • 现场编辑选项卡,选择任务>清除异常数据

  • 在脚本的代码块中,键入相关的关键字,例如离群值清洁.选择清除异常数据从建议的命令完成。

参数

此任务对类型为的数据进行操作仅有一个的双重的包含在向量或表变量中。当为输入数据提供表或时间表时,请指定所有支持金宝app的变量使用类型清除所有变量的步骤仅有一个的双重的,或选择仅有一个的双重的选择要清除的变量指定变量然后分别选择变量。

指定使用以下选项之一填充异常值的方法。

填充法 描述
线性插值 邻近的线性插值,非离群值。
定值 指定的标量值,即0默认情况下。
中心值 由“查找”方法确定的中心值。
剪辑到阈值 为小于“查找”方法确定的下限阈值的图元填充下限阈值。使用大于“查找”方法确定的上限阈值的图元的上限阈值进行填充。
之前的值 以前nonoutlier价值。
下一个值 下一个非离群值。
最近值 最近的非离群值。
样条插值 分段三次样条插值。
保形三次插值(PCHIP) 保形分段三次样条插值。
修正的Akima三次插值 改进的Akima三次Hermite插值。

使用下列选项之一指定用于查找异常值的检测方法。

方法 描述
移动中间带 离群值定义为超过指定窗口上的局部中值的局部缩放MAD的指定阈值的元素。默认阈值为3.
中值的 离群值定义为超过中位数的比例中位数绝对偏差(MAD)指定阈值的元素,即3.默认情况下。对输入数据A.,缩放的MAD定义为c *值(abs(中位数(A)))哪里c=-1/(平方英尺(2)*erfcinv(3/2))
的意思是 离群值定义为超过平均值标准偏差规定阈值的元素,即3.默认情况下。这种方法比其他方法更快,但鲁棒性较差中值的
四分位数 离群值定义为高于上四分位数(75%)或低于下四分位数(25%)的四分位数范围规定阈值的元素,即1.5默认情况下。当输入数据不是正态分布时,此方法非常有用。
格拉布斯 使用Grubbs检验检测异常值,该检验基于假设检验,每次迭代移除一个异常值。此方法假定输入数据是正态分布的。
广义极值学习偏差 使用异常值的广义极端学生偏差测试检测异常值。这种迭代方法类似于格拉布斯,但当多个异常值相互掩蔽时,性能会更好。
移动平均数 离群值被定义为超过指定窗口内局部平均值的局部标准偏差的指定阈值的元素。默认阈值为3.
百分位数 异常值定义为上限和下限阈值指定的百分位范围之外的元素。默认的较低百分位阈值为10默认的上限百分比阈值是90. 有效阈值在区间[0100]内。

指定当检测异常值的方法为空时的窗口类型和大小移动中间带移动平均数

描述
居中的 以当前点为中心的指定窗口长度。
不对称 指定的窗口,包含当前点之前的元素数量和当前点之后的元素数量。

窗口大小是相对于X轴可变单位。

在R2019b中引入