主要内容

knnsearch

通过编辑距离查找最近的邻居

描述

例子

idx=KNN搜索(eds.,)在编辑距离搜索器中查找最近邻居的索引eds.到中的每个元素.

例子

[idx,D]=KNN搜索(eds.,)还返回元素之间的编辑距离和最近的邻居。

例子

[idx,D]=KNN搜索(eds.,,名称、值)使用一个或多个名称-值对参数指定其他选项。

例子

全部崩溃

创建编辑距离搜索器。

词汇=[“文本”“分析”“工具箱”]eds=editDistanceSearcher(词汇表,2);

找到最接近的单词“测试”“分析”.

单词=[“测试”“分析”];idx=KNN搜索(eds,单词)
idx=2×11 2

使用返回的指数获取词汇表的单词。

regientwords = eds.vocabulary(IDX)
近义词=1x2串“文本”“分析”

创建编辑距离搜索器。

词汇=[“matlab”“文本”“分析”“工具箱”]eds=editDistanceSearcher(词汇表,2);

查找最接近的单词及其编辑距离“测试”“分析”.

单词=[“测试”“分析”];[idx,d]=knSearch(eds,words)
idx=2×12 3.
d =2×11 2

使用返回的指数获取词汇表的单词。

regientwords = eds.vocabulary(IDX)
近义词=1x2串“文本”“分析”

换词“测试”“文本”需要一个编辑:替换。换词“分析”进入“分析”需要两次编辑:替换和插入。

创建编辑距离搜索器。

词汇=[“MathWorks”“matlab”“分析”]eds=editDistanceSearcher(词汇表,5);

查找最近的两个单词及其编辑距离“数学”“分析”.

单词=[“数学”“分析”];idx=knnsearch(eds、单词、,'K',2)
idx=2×2123Nan

查看最接近的两个单词“数学”.

idxmath = idx(1,:);新字= eds.vocabulary(idxmath)
新词=1x2串“mathworks”“matlab”

最大编辑距离中只有一个单词“分析”,所以函数返回对于其他索引。查看具有有效索引的最近单词。

idx分析=idx(2,:);idxAnalysis(isnan(idxAnalysis))=[];newWords=eds.词汇表(idx分析)
newWords=“分析”

输入参数

全部崩溃

编辑距离搜索器,指定为编辑距离搜索器目的。

输入字,指定为字符串向量、字符向量或字符向量的单元格数组。如果指定作为一个字符向量,该函数将参数视为一个单词。

数据类型:一串|char|细胞

名称-值对参数

指定可选的逗号分隔的字符对名称、值论点。名称是参数名和价值是相应的价值。名称必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:name1,value1,...,namen,valuen.

例子:knnsearch(eds,单词,'K',3)找到最近的三个邻居eds.关于.

中每个元素要查找的最近邻数,指定为正整数。

例子:“K”,3

数据类型:单一的|双重的|int8|int16|INT32.|int64|uint8|uint16|uint32|uint64

选项返回距离值相等的邻居,指定为真的或者假的.

如果“包括”假的,然后函数返回K邻居具有最短的编辑距离,在哪里K要查找的邻居数。在本例中,函数输出N-经过-K矩阵,其中N是输入字数。若要指定K,使用'K'名称-值对参数。

如果“包括”真的,则该函数还返回距离等于K输出中的最小距离。在这种情况下,函数输出大小为的单元格数组N-比1,在哪里N是输入单词的数量。电池阵列的元素至少是具有至少的向量K元素。该功能按距离的升序排序每个向量中的邻居。

例子:“包含”,没错

数据类型:符合逻辑的

输出参数

全部崩溃

搜索者中最近邻居的指数,作为矩阵或电池数组返回。

如果“包括”假的,然后函数返回K邻居具有最短的编辑距离,在哪里K要查找的邻居数。在本例中,函数输出N-经过-K矩阵,其中N是输入字数。若要指定K,使用'K'名称-值对参数。

如果“包括”真的,则该函数还返回距离等于K输出中的最小距离。在这种情况下,函数输出大小为的单元格数组N-比1,在哪里N是输入单词的数量。电池阵列的元素至少是具有至少的向量K元素。该功能按距离的升序排序每个向量中的邻居。

数据类型:双重的|细胞

编辑邻居的距离,返回为矩阵或传感器的单元格数组。

如果“包括”假的,然后函数返回K邻居具有最短的编辑距离,在哪里K要查找的邻居数。在本例中,函数输出N-经过-K矩阵,其中N是输入字数。若要指定K,使用'K'名称-值对参数。

如果“包括”真的,则该函数还返回距离等于K输出中的最小距离。在这种情况下,函数输出大小为的单元格数组N-比1,在哪里N是输入单词的数量。电池阵列的元素至少是具有至少的向量K元素。该功能按距离的升序排序每个向量中的邻居。

数据类型:双重的|细胞

在R2019a中引入