由于它们的部分持续时间的差异,以相同顺序排列的等效特征的两个信号可能出现非常不同。edr.
扭曲这些持续时间,使得相应的特征在公共时轴上出现在相同的位置,从而突出显示信号之间的相似性。用于执行失真的标准被设计为对异常值强大。
考虑两者K.- 尺寸的信号
和
其中有m和N分别样品。给予D.m(X那y),之间的距离m样本X和N样本y指定公制
, 这edr.
功能延伸X和y在一套常见的瞬间,这样编辑距离在信号之间最小。
给予ε.,实际数字是指定的公差托
,声明m样本X和N样本y匹配如果D.m(X那y)<ε.。如果两个样本,m和N,不匹配,您可以以三种方式中的任何一种使其匹配:
消除m从第一信号,例如当下一个样本匹配时N。此删除相当于添加m到第二信号并获得两个连续匹配。
通过添加匹配的样本来延长第一个信号N并通过一个位置移位其余的样本。此添加是等同于删除无与伦比的N从第二信号。
代替m和N在第一信号中,或等效地,取下两者m和N。
编辑距离是使两个信号匹配所需的这些操作的总数。这个数字不是唯一的。计算之间的最小可能的编辑距离X和y,从这些事实开始:
两个空信号在它们之间有零距离。
空信号与信号之间的距离L.样品是L.,因为这是必须添加到空信号的样本数以恢复另一个。同等,L.是必须从中删除的样本数量L.-Ample信号清空它。
创建一个(m+ 1)--by-(N+ 1)矩阵,D.,这样的:
D.1,1= 0.。
D.m,1=m- 1为了m= 2,......,m+ 1。
D.1,N=N- 1为了N= 2,......,N+ 1。
为了m那N> 1那
最小的编辑距离X和y那么D.m+1,N+1。
这翘曲路径通过D.这导致这一最小的编辑距离由相同长度的两个序列参数化,IX.
和IY.
,并是“国际象棋王”的组合:
垂直移动:(m那N)→(m+ 1,N)对应于从中移除样品X或添加样本到y。每个移动将编辑距离增加1。
水平移动:(m那N)→(m那N+ 1)对应于从中移除样品y或添加样本到X。每个移动将编辑距离增加1。
对角线移动:(m那N)→(m+ 1,N+ 1)如果匹配,则对应匹配D.m,n(X那y)≤.ε.或者对应于从每个信号中移除一个样本D.m,n(X那y)ε.。匹配不会增加距离。除去将其增加1。
该结构确保任何可接受的路径对齐完整信号,不跳过样本,并且不重复信号特征。另外,一个理想的路径靠近延伸到的对角线D.1,1(X那y) 和D.M,N.(X那y)。这种额外的约束,调整了maxsamp.
参数,确保翘曲比较相似长度的截面。
制作两个样本匹配的惩罚与样品之间的价值差异无关。两个不同的样本比耐受性不同,这两个样本具有与显着不同的两个样本相同的惩罚。因此,编辑距离不受异常值的影响。相反,重复样品以对准两个信号具有成本,这是动态时间翘曲的情况并非如此。