主要内容

hampel

使用Hampel标识符去除离群值

描述

例子

y= hampel (x对输入向量应用汉普尔滤波器,x,以检测和去除异常值。的每个样本x,该函数计算由样本和它周围的六个样本组成的窗口的中值,每边三个。它还使用中位数绝对偏差估计每个样本关于其窗口中位数的标准偏差。如果一个样本与中值相差超过三个标准差,就用中值替换。如果x是一个矩阵hampel处理每一列x作为一个独立的渠道。

y= hampel (xk指定邻居的数量,k,在每个样品的两边x在测量窗口中。k默认为3。

例子

y= hampel (xknsigma指定一些标准偏差,nsigma,其中的一个样本x必须与本地中值不同,才能用中值替换。nsigma默认为3。

例子

yj) = hampel (<年代pan class="argument_placeholder">___还返回一个逻辑矩阵,该矩阵在所有被识别为离群值的点的位置上为真。该语法接受前面语法中的任何输入参数。

例子

yjxmedianψ) = hampel (<年代pan class="argument_placeholder">___的局部中位数和估计的标准偏差x

hampel (<年代pan class="argument_placeholder">___在没有输出参数的情况下,绘制过滤后的信号并注释被删除的离群值。

例子

全部折叠

生成100个正弦信号样本。用尖刺替换第6和第20个样品。

x =罪(2 *π* (0:99)/ 100);x (6) = 2;x (20) = 2;

使用hampel找出每一个与当地中位数相差超过三个标准差的样本。测量窗口由样品及其周围的6个样品组成,每边3个。

[y,我xmedianψ]= hampel (x);

绘制滤波信号并标注离群值。

n = 1:长度(x);情节(n, x)<年代pan style="color:#A020F0">在xmedian-3 *ψ情节(n, n, xmedian + 3 *ψ)情节(找到(i), x (i),<年代pan style="color:#A020F0">“sk”)举行<年代pan style="color:#A020F0">从传奇(<年代pan style="color:#A020F0">原始信号的,<年代pan style="color:#A020F0">“下限”,<年代pan style="color:#A020F0">“上限”,<年代pan style="color:#A020F0">“离群值”

图中包含一个轴对象。轴对象包含4个类型为line的对象。这些对象代表原始信号,下限,上限,异常值。

重复计算,但在计算中值时,只在每一边取一个相邻的样本。该函数将极值视为异常值。

hampel (x, 1)

图中包含一个轴对象。轴对象包含3个类型为line的对象。这些对象代表原始信号,滤波信号,离群值。

产生由不同频率的正弦波组成的双通道信号。在随机的地方放置尖峰。使用nan随机添加缺失的样本。重置随机数生成器以获得可重复的结果。画出信号。

rng (<年代pan style="color:#A020F0">“默认”n = 59;x =罪(π。/[15 10]'*(1:n)+pi/3)'; spk = randi(2*n,9,1); x(spk) = x(spk)*2; x(randi(2*n,6,1)) = NaN; plot(x)

图中包含一个轴对象。轴对象包含两个类型为line的对象。

使用以下方法对信号进行滤波hampel使用默认设置。

y = hampel (x);情节(y)

图中包含一个轴对象。轴对象包含两个类型为line的对象。

增加移动窗口的长度,降低阈值,将样本视为离群值。

y = hampel (x 4 2);情节(y)

图中包含一个轴对象。轴对象包含两个类型为line的对象。

输出每个通道的运行中值。在信号图上叠加中值。

(y, j, xmd, xsd) = hampel (x, 4, 2);情节(x)<年代pan style="color:#A020F0">在情节(xmd<年代pan style="color:#A020F0">“——”

图中包含一个轴对象。轴对象包含4个类型为line的对象。

产生一个多通道信号,由嵌入单位方差高斯白噪声的两个不同频率的正弦波组成。

rng (<年代pan style="color:#A020F0">“默认”t = 0;x =罪(pi. / (10; 2) * t)”+ randn(元素个数(t) 2);

对信号应用汉普尔滤波器。将那些与周围九个样本窗口的中值相差超过两个标准差的点作为离群点。输出一个逻辑矩阵,在离群点的位置为真。

k = 4;nsig = 2;[y, h] = hampel (x, k, nsig);

用它自己的一组坐标轴绘制信号的每个通道。画出原始信号、滤波信号和异常值。注释离群点位置。

K = 1 and h = 1;ax =情节(2,1,k);情节(t) x (:, k))<年代pan style="color:#A020F0">在情节(t y (:, k))情节(t(香港),x(香港,k),<年代pan style="color:#A020F0">‘*’)举行<年代pan style="color:#A020F0">从斧子。XTick = t(香港);<年代pan style="color:#0000FF">结束

图中包含2个轴对象。坐标轴对象1包含3个类型为line的对象。axis对象2包含3个类型为line的对象。

生成100个正弦信号样本。用尖刺替换第6和第20个样品。

n = 1:10 0;x =罪(2 *π* n / 100);x (6) = 2;x (20) = 2;

使用hampel计算每个样本的局部中值和估计标准差。输入参数使用默认值:

  • 窗口大小为<年代pan class="inlineequation"> 2<米o> × 3.<米o> + 1<米o> = 7

  • 与窗口中值相差超过三个标准差的点被认为是异常值。

  • 策划的结果。

    [y,我xmedianψ]= hampel (x);情节(n, x)<年代pan style="color:#A020F0">在情节(n, [1; 1] * xmedian + 3 *[1; 1] *ψ)情节(找到(i), x (i),<年代pan style="color:#A020F0">“sk”)举行<年代pan style="color:#A020F0">从传奇(<年代pan style="color:#A020F0">“信号”,<年代pan style="color:#A020F0">“低”,<年代pan style="color:#A020F0">“上”,<年代pan style="color:#A020F0">“离群值”

    图中包含一个轴对象。轴对象包含4个类型为line的对象。这些对象代表信号,下,上,离群值。

    使用窗口大小重复计算<年代pan class="inlineequation"> 2<米o> × 1<米n>0<米o> + 1<米o> = 2<米n>1 用两个标准差作为判断异常值的标准。

    sds = 2;disorderly = 10;[y,我xmedianψ]= hampel (x的sds);情节(n, x)<年代pan style="color:#A020F0">在情节(n, [1; 1] * xmedian + sds *[1; 1] *ψ)情节(找到(i), x (i),<年代pan style="color:#A020F0">“sk”)举行<年代pan style="color:#A020F0">从传奇(<年代pan style="color:#A020F0">“信号”,<年代pan style="color:#A020F0">“低”,<年代pan style="color:#A020F0">“上”,<年代pan style="color:#A020F0">“离群值”

    图中包含一个轴对象。轴对象包含4个类型为line的对象。这些对象代表信号,下,上,离群值。

    输入参数

    全部折叠

    输入信号,指定为向量或矩阵。如果x是一个矩阵hampel处理每一列x作为一个独立的渠道。

    例子:因为(π/ 4 * (0:159))+ randn (1160)是单通道行向量信号。

    例子:因为(pi. / (4; 2) * (0:159)) ' + randn (160 2)是一个双通道信号。

    数据类型:|

    样本两边的邻居数<年代pan class="inlineequation">x<年代ub>年代,指定为整数标量。接近信号边缘的采样值小于k一边的样本与较小窗口的中值进行比较。

    数据类型:|

    样本的标准差数x必须与其本地中值不同,才能被视为离群值。指定nsigma作为实标量。该函数通过将局部中值绝对偏差(MAD)缩放一个因子来估计标准差<年代pan class="inlineequation"> κ<米o> = 1<米row> 2 小块土地 1 1<米o> / 2 1.4826

    数据类型:|

    输出参数

    全部折叠

    过滤后的信号,返回为大小相同的向量或矩阵x

    数据类型:|

    离群值索引,作为大小相同的向量或矩阵返回x

    数据类型:逻辑

    作为大小相同的向量或矩阵返回x

    数据类型:|

    估计的标准偏差,以相同大小的向量或矩阵返回x

    数据类型:|

    更多关于

    全部折叠

    Hampel标识符

    汉普尔标识符是统计的三西格玛规则的变体,对异常值是稳健的。

    给定一个序列<年代pan class="inlineequation">x1x2x3.、……x<年代ub>n还有一扇滑动的长窗k,定义点对点的中位数和标准差估计值,使用: