主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

hampel

Hampel識別子を使用した外れ値の削除

説明

y= hampel (xは,Hampelフィルターを入力ベクトルxに適用し,外れ値の検出および削除を行います。この関数は,xのサンプルごとに,そのサンプルと周囲の6個のサンプル(左右の各3個)で構成されるウィンドウの中央値を計算します。また,中央絶対偏差を使用して,ウィンドウ中央値に対する各サンプルの標準偏差も推定します。サンプルが中央値から標準偏差の 3 倍より大きく離れている場合には、中央値と置き換えられます。xが行列の場合,hampelxの各列を独立チャネルとして扱います。

y= hampel (xkは,xの各サンプルに対する,測定ウィンドウにおける右側と左側の各近傍の数kを指定します。kの既定値は3です。

y= hampel (xknsigmaは,xのサンプルが,局所的中央値から標準偏差の何倍分離れていたら中央値と置き換えられるかを指示する標準偏差の個数nsigmaを指定します。nsigmaの既定値は3です。

yj) = hampel (___も,外れ値として識別されたすべての点の位置で真正である逻辑行列を返します。この構文は,前の構文の任意の入力引数を受け入れます。

yjxmedianψ) = hampel (___も,xの各要素の局所的中央値と推定標準偏差を返します。

出力引数なしのhampel (___は,フィルター処理した信号をプロットして,削除された外れ値に注釈を付けます。

すべて折りたたむ

正弦波信号のサンプルを100個生成します。6番目と20番目のサンプルをスパイクに置き換えます。

x =罪(2 *π* (0:99)/ 100);x (6) = 2;x (20) = 2;

hampelを使用して,局所的中央値から3標準偏差を超えて離れた位置にあるすべてのサンプルを特定します。測定ウィンドウは,そのサンプルと周囲の6個のサンプル(片側ごとに3個)で構成されます。

[y,我xmedianψ]= hampel (x);

フィルター処理された信号をプロットし,外れ値に注釈を付けます。

n = 1:长度(x);情节(n, x)xmedian-3 *ψ情节(n, n, xmedian + 3 *ψ)情节(找到(i), x (i),“sk”)举行传奇(原始信号的“下限”“上限”“离群值”

图中包含一个轴。坐标轴包含4个类型线对象。这些对象代表原始信号、下限、上限、离群值。

計算を繰り返しますが,今度は中央値の計算に,両側の隣接サンプルをそれぞれ1つのみ使用します。関数は,極値を外れ値と見なします。

hampel (x, 1)

图中包含一个轴。坐标轴包含3个类型线对象。这些对象代表原始信号,滤波信号,离群值。

異なる周波数の正弦波で構成される2チャネル信号を生成します。ランダムな位置にスパイクを配置します。南を使用し,欠損サンプルをランダムに追加します。再現可能な結果が必要な場合は,乱数発生器をリセットします。信号をプロットします。

rng (“默认”) n = 59;x =罪(π。/[15 10]'*(1:n)+pi/3)'; spk = randi(2*n,9,1); x(spk) = x(spk)*2; x(randi(2*n,6,1)) = NaN; plot(x)

图中包含一个轴。坐标轴包含两个类型线对象。

hampelを既定の設定で使用して,信号をフィルター処理します。

y = hampel (x);情节(y)

图中包含一个轴。坐标轴包含两个类型线对象。

移動ウィンドウの長さを増やし,サンプルを外れ値として扱うしきい値を下げます。

y = hampel (x 4 2);情节(y)

图中包含一个轴。坐标轴包含两个类型线对象。

各チャネルの移動中央値を出力します。信号のプロットに中央値を重ね合わせます。

(y, j, xmd, xsd) = hampel (x, 4, 2);情节(x)情节(xmd“——”

图中包含一个轴。坐标轴包含4个类型线对象。

単位分散のホワイトガウスノイズ内の,周波数が異なる2つの正弦波から構成されるマルチチャネル信号を生成します。

rng (“默认”) t = 0:60;x =罪(pi. / (10; 2) * t)”+ randn(元素个数(t) 2);

信号にHampelフィルターを適用します。周囲9サンプルのウィンドウの中央値から2標準偏差を超えて離れている点を外れ値とします。外れ値の位置で真正となる逻辑行列を出力します。

k = 4;nsig = 2;[y, h] = hampel (x, k, nsig);

信号の各チャネルを,それ自体の座標軸セットにプロットします。元の信号,フィルター処理した信号および外れ値を描画します。外れ値の位置に注釈を付けます。

K = 1:2 hk = h(:, K);ax =情节(2,1,k);情节(t) x (:, k))情节(t y (:, k))情节(t(香港),x(香港,k),‘*’)举行斧子。XTick = t(香港);结束

图中包含2个轴。轴1包含3个类型线对象。轴2包含3个类型线对象。

正弦波信号のサンプルを100個生成します。6番目と20番目のサンプルをスパイクに置き換えます。

n = 1:10 0;x =罪(2 *π* n / 100);x (6) = 2;x (20) = 2;

hampelを使用して,すべてのサンプルに対する局所的中央値と推定標準偏差を計算します。入力パラメーターの既定値を使用します。

  • ウィンドウサイズは 2 × 3. + 1 7 です。

  • ウィンドウの中央値から3標準偏差を超えて離れている点は外れ値と見なされます。

結果をプロットします。

[y,我xmedianψ]= hampel (x);情节(n, x)情节(n, [1; 1] * xmedian + 3 *[1; 1] *ψ)情节(找到(i), x (i),“sk”)举行传奇(“信号”“低”“上”“离群值”

图中包含一个轴。坐标轴包含4个类型线对象。这些对象代表信号,低,高,离群值。

2 × 1 0 + 1 2 1 のウィンドウサイズと,外れ値の識別基準として2標準偏差を使用して,計算を繰り返します。

sds = 2;disorderly = 10;[y,我xmedianψ]= hampel (x的sds);情节(n, x)情节(n, [1; 1] * xmedian + sds *[1; 1] *ψ)情节(找到(i), x (i),“sk”)举行传奇(“信号”“低”“上”“离群值”

图中包含一个轴。坐标轴包含4个类型线对象。这些对象代表信号,低,高,离群值。

入力引数

すべて折りたたむ

ベクトルまたは行列として指定される入力信号。xが行列の場合,hampelxの各列を独立チャネルとして扱います。

例:因为(π/ 4 * (0:159))+ randn (1160)は単一チャネルの行ベクトル信号です。

例:因为(pi. / (4; 2) * (0:159)) ' + randn (160 2)は2チャネル信号です。

データ型:|

サンプルx年代のそれぞれの側の近傍の数。整数値スカラーで指定します。片側のサンプル数がkより少ない信号エッジの近傍のサンプルは,より小さいウィンドウの中央値と比較されます。

データ型:|

xのサンプルが,サンプルの局所的中央値から標準偏差の何倍分離れていたら外れ値と見なされるかを指示する標準偏差の個数。nsigmaを実数スカラーで指定します。この関数は,局所的な中央絶対偏差 (MAD) を κ 1 2 小块土地 1 1 / 2 1.4826 の係数でスケーリングすることによって標準偏差を推定します。

データ型:|

出力引数

すべて折りたたむ

xと同じサイズのベクトルまたは行列として返されるフィルター処理された信号。

データ型:|

外れ値のインデックス。xと同じサイズのベクトルまたは行列として返されます。

データ型:逻辑

局所的な中央値。xと同じサイズのベクトルまたは行列として返されます。

データ型:|

推定標準偏差。xと同じサイズのベクトルまたは行列として返されます。

データ型:|

詳細

すべて折りたたむ

Hampel識別子

Hampel識別子は,外れ値に対してロバストな,統計の3シグマルールの一種です。

たとえば,シーケンスx1, x2, x3.x、…nと長さkのスライディングウィンドウの場合,ポイントツーポイントの中央値と標準偏差推定は以下を使用して定義します。

  • 局所的中央値 中位数 x k x k + 1 x k + 2 ... x ... x + k 2 x + k 1 x + k

  • 標準偏差- σ κ 中位数 | x k | ... | x + k | ここで κ 1 2 小块土地 1 1 / 2 1.4826

σの量は中央絶対偏差(疯狂)として知られています。

サンプルxが,与えられたしきい値nσに対して以下の条件を満たすとします。

| x | > n σ σ

このとき,Hampel識別子はxを外れ値として宣言し,mで置き換えます。

シーケンス端点付近で,mおよびσの計算に使用するウィンドウが関数によって打ち切られます。

  • I < k + 1

    中位数 x 1 x 2 x 3. ... x ... x + k 2 x + k 1 x + k

    σ κ 中位数 | x 1 1 | ... | x + k |

  • 我> n - k

    中位数 x k x k + 1 x k + 2 ... x ... x n 2 x n 1 x n

    σ κ 中位数 | x k | ... | x n n |

参照

[1] Liu, Hancong, siish Shah和Wei Jiang。“在线异常点检测和数据清理。”计算机与化学工程“,”第28卷,2004年3月,1635-1647页。

[2] Suomela Jukka。“中值过滤等同于排序。”2014.

R2015bで導入