基于密度的数据聚类算法
clusterDBSCAN
聚类数据点属于P-维特征空间采用基于密度的应用空间聚类(DBSCAN)算法。聚类算法将特征空间中彼此接近的点分配到单个聚类中。例如,雷达系统可以返回距离、角度和多普勒距离较近的扩展目标的多个探测结果。clusterDBSCAN
将这些检测分配给单个检测。
DBSCAN算法假设聚类是数据空间中被低密度区域分开的密集区域,所有密集区域具有相似的密度。
为了测量一个点的密度,该算法计算该点附近的数据点的数量。一个社区是一个P特征空间的-维椭圆(超椭圆)。椭圆的半径是由P向量ε。ε可以是标量,在这种情况下,超椭圆变成了超球。利用欧几里得距离度量计算特征空间中点之间的距离。邻域称为ε邻域。ε值由ε
财产。ε
可以是标量还是P向量:
当特征空间的不同维度有不同的单位时,使用向量。
标量对所有维度都适用相同的值。
集群首先要找到所有核心点。如果一个点在其ε邻域内有足够多的点,则称之为核心点。一个点成为核心点所需的最低分数是由MinNumPoints
财产。
核点ε邻域内的剩余点可以是核点本身。如果不是,那就是边境点。ε邻域内的所有点称为直接密度可及从核心点。
如果一个核点的ε邻域包含其他核点,则所有核点的ε邻域内的点合并在一起形成ε邻域并集。这个过程会一直持续下去,直到不能再添加核心点为止。
ε邻域并集中的所有点为密度可及从第一个核心点开始。事实上,并集中的所有点都是从并集的所有核心点密度可达的。
ε邻域并中的所有点也被称为ε邻域密度连接尽管边界点不一定是可获得的从对方。一个集群是密度连通点的最大集合,可以有任意形状。
不是核心点或边界点的点是噪音点。它们不属于任何集群。
的clusterDBSCAN
对象可以使用k-nearest neighbor search,或者可以指定值。为了让对象估计ε,设置EpsilonSource
财产“汽车”
.
的clusterDBSCAN
对象可以消除包含歧义的数据。距离和多普勒是可能存在模糊数据的例子。集EnableDisambiguation
财产真正的
消除歧义的数据。
集群检测:
创建clusterDBSCAN
对象,并设置其属性。
使用参数调用对象,就像调用函数一样。
要了解更多关于System对象如何工作的信息,请参见什么是系统对象?
创建一个clusterer运算
= clusterDBSCANclusterDBSCAN
对象,clusterer运算
,对象的默认属性值。
创建一个clusterer运算
= clusterDBSCAN(名称,值)clusterDBSCAN
对象,clusterer运算
,并使用每个指定的属性的名字
设置为指定的价值
.可以以任意顺序指定其他名称-值对参数,如(Name1
,Value1
,...,以
,家
).任何未指定的属性都接受默认值。例如,
clusterer运算= clusterDBSCAN (“MinNumPoints”3,‘ε’2,...“EnableDisambiguation”,真的,“AmbiguousDimension”[1, 2]);
EnableDisambiguation
属性设置为true,则AmbiguousDimension
设置为[1,2]
.
[
也返回一个备用的集群id集,idx
,clusterids
] = clusterer运算(X
)clusterids
,用于分阶段。RangeEstimator
和分阶段。DopplerEstimator
对象。clusterids
为每个噪声点分配一个唯一的ID。
要使用对象函数,请指定System对象™作为第一个输入参数。例如,释放名为system的对象的系统资源obj
,使用下面的语法:
发行版(obj)
Ester M., Kriegel h . p ., Sander J., Xu X.。“基于密度的大型空间数据库聚类发现算法”。Proc。第二Int。知识发现与数据挖掘研讨会,波特兰,奥尔特,AAAI出版社,1996,第226-231页。
[2]埃里希·舒伯特,Jörg桑达,马丁·埃斯特,汉斯-彼得·克里格尔,徐晓伟。2017。DBSCAN Revisited, Revisited: Why and How You Should (Still) Use DBSCANACM反式。数据库系统。42,3,第19条(2017年7月),21页。
[3] Dominik Kellner, Jens Klappstein and Klaus Dietmayer,“基于网格的DBSCAN雷达数据扩展目标聚类”,2012 IEEE智能汽车研讨会.
[4] Thomas Wagner, Reinhard Feger, and Andreas Stelzer,“一种用于距离/多普勒/DoA测量的快速网格聚类算法”,第十三届欧洲雷达会议论文集.
[5] Mihael Ankerst, Markus M. Breunig, Hans-Peter Kriegel, Jörg Sander,《OPTICS:排序点识别集群结构》,Proc. ACM SIGMOD ' 99 Int。关于数据管理的会议1999年,宾夕法尼亚州费城。