同じ順序に並んだ同等の特徴をもつ2つの信号が,セクションの持続時間の違いによって大きく異なって見える場合があります。功能
はこれらの持続時間を歪ませて,対応する特徴が共通の時間軸上の同じ位置に現れるようにさせ,信号間の類似点を強調します。歪みを実行するために使用される基準は,外れ値に対してロバストになるように設計されています。
次の2のk次元信号を考えます。
および
これらの信号には,それぞれm個とn個のサンプルがあります。度规
で指定されたXのm番目のサンプルとYのn番目のサンプルの間の距離d锰(X,Y)が与えられた場合,関数功能
はXとYを,信号間の“編集距離”が最小となる時点の共通集合上で引き伸ばします。
托尔
に指定された許容誤差である実数εが与えられたとき,d锰(X,Y) < εの場合にXのm番目のサンプルとYのn番目のサンプルが“一致する”ことを宣言します。2つのサンプルの m と n が一致しない場合には、次の 3 つの方法のいずれかでそれらを一致させることができます。
次のサンプルがnに一致する場合などは,最初の信号からmを削除します。この削除は,mを2目の信号に追加して,2の連続一致を得ることと等価です。
nに一致するサンプルを適切な位置に追加し,残りのサンプルの位置を1つ移動することにより,最初の信号の長さを引き伸ばします。この追加は、一致しないnを2目の信号から削除することと等価です。
最初の信号でmにnを代入します。または、同等の操作として、m と n の両方を削除します。
編集距離は,2の信号を一致させるために必要なこれらの操作の合計数です。この数値は一意ではありません。XとY間の編集距離ができるだけ小さくなるように計算するには,次の事実に基づいて開始します。
2 .の空の信号間の距離は,ゼロです。
空の信号とl個のサンプルをも信号間の距離はlです。これは,他の信号を復元するために,空の信号に追加する必要があるサンプル数であるためです。これはすなわちLはLサンプル信号を空にするために削除しなければならないサンプルの数ということです。
次のように(m + 1)行(n + 1)列の行列Dを作成します。
D1, - 1= 0.
Dm, 1= m - 1(m = 2,…,m + 1)
D1, n= n - 1(n = 2,…,n + 1)
M, n > 1の場合,
したがって,XとY間の最小の編集距離は,DM + 1, N + 1となります。
この編集距離が最小となるD経由の“ワ,ピングパス”は,次のように,同じ長さの2のシ,ケンス9
およびiy
によってパラメ,タ,化され,“チェスのキング”の動きの組み合わせになります。
垂直方向の動き:(m,n)→(m + 1,n)は,Xからのサンプルの削除,またはYへのサンプルの追加に対応します。それぞれの移動では,編集距離が1増えます。
水平方向の動き:(m,n)→(m,n + 1)は,Yからのサンプルの削除,またはXへのサンプルの追加に対応します。それぞれの移動では,編集距離が1増えます。
対角方向の動き:(m,n)→(m + 1,n + 1)は,dm, n(X,Y)≤εの場合は一致に対応,dm, n(X,Y) > εの場合は各信号からの1サンプル削除に対応します。一致による距離の増加はありません。削除では1増えます。
この構造では,条件に合うパスがいずれも,サンプルをスキップしたり,信号の特徴を反復したりせず,すべての信号を揃えることが確保されます。さらに,望ましいパスは,d1, - 1(X,Y)とdM, N(X,Y)の間に伸びる対角方向のラleiンの近くを通ります。maxsamp
引数で調整されるこの追加の制約により,長さが類似するセクションのワーピングによる比較が必ず行われます。
2 .のサンプルを一致させるためのペナルティは,サンプル間の値の違いとは無関係です。許容誤差をわずかに超える差がある 2 つのサンプルが、その差が著しい 2 つのサンプルと同じペナルティを受けます。そのため、編集距離は外れ値の影響を受けません。一方、2 つの信号を揃えるためにサンプルを繰り返すことにはコストがかかります。これは動的タイム ワーピングの場合は該当しません。