一个最近邻搜索位于k-最近邻居或指定距离内的所有邻居,根据指定的距离度量查询数据点。可用的距离度量包括欧几里得、汉明和马氏等。
Statistics and Machine Learning Toolbox™提供了两种寻找最近邻的方法。您可以使用训练数据集创建一个搜索器对象,并将对象和查询数据集传递给对象函数(knnsearch
和rangesearch
).或者,你可以用knnsearch
和rangesearch
函数,它直接接受训练数据集和查询数据集。当您有多个查询数据集时,最好创建一个搜索器对象,因为搜索器对象存储了数据集的公共信息。例如,一个KDTreeSearcher
对象存储Kd-tree。
使用各种距离度量,根据数据点到训练数据集中点的距离对数据点进行分类。