主要内容

DaviesBouldinEvaluation

包裹:clustering.evaluation
超类:ClusterCriterion

Davies-Bouldin标准聚类评估对象

描述

DaviesBouldinEvaluation是由样本数据、聚类数据和用于评估最优聚类数量的Davies-Bouldin标准值组成的对象。使用。创建Davies-Bouldin标准聚类评估对象evallusters.

建造

伊娃= Expluckers(Xclust,'daviesbouldin')创建Davies-Bouldin标准聚类评价对象。

伊娃= Expluckers(Xclust,'daviesbouldin',名称,值使用由一个或多个名称-值对参数指定的附加选项创建Davies-Bouldin标准聚类评估对象。

输入参数

全部展开

输入数据,指定为N——- - - - - -P.矩阵。N是观察人数,和P.是变量的个数。

数据类型:单身的|

聚类算法,指定为以下之一。

“kmeans” 将数据聚在X使用kmeans聚类算法,'空洞'设置为“单”'复制'设置为5.
'连锁' 将数据聚在X使用clusterdata凝聚聚类算法,有'连锁'设置为“沃德”
'GMDistribution' 将数据聚在X使用gmdistribution高斯混合分配算法,有'sharedcov'设置为真正的'复制'设置为5.

如果标准'calinskiharabasz'“DaviesBouldin”, 或者“剪影”,您可以使用功能手柄.函数必须具有这种形式C = clustfun(数据、K),在那里数据数据是要群集的,还是K.是群集的数量。输出Clustfun.必须是以下之一:

  • 表示中每个观察的聚类索引的整数向量数据.必须有K.此向量中的唯一值。

  • 数字N——- - - - - -K.分数矩阵N观察和K.课程。在这种情况下,通过在每行中取得最大的得分值来确定每个观察的集群索引。

如果标准'calinskiharabasz'“DaviesBouldin”, 或者“剪影”,您还可以指定clust作为一个N——- - - - - -K.矩阵包含提出的聚类解决方案。金宝搏官方网站N是样本数据中的观察数,和K.是建议的聚类解决方案的数量。金宝搏官方网站柱子j的集群索引Nj集群解决方案。

数据类型:单身的||字符|细绳|function_handle.

名称-值对的观点

指定可选的逗号分离对名称,值参数。名称是参数名称和价值是对应的值。名称必须出现在引号内。您可以按如下顺序指定几个名称和值对参数Name1, Value1,…,的家

例子:'klist',[1:5]指定测试1,2,3,4和5个集群以查找最佳数量。

要计算的集群数量的列表,指定为逗号分隔的对,由“中”一个正整数的向量。您必须指定clust是群集算法名称或函数句柄。什么时候标准'差距'clust必须是字符向量,字符串标量或函数句柄,并且必须指定

例子:'klist',[1:6]

数据类型:单身的|

特性

clusteringfunction.

用于群集输入数据的聚类算法,存储为有效的群集算法名称或功能句柄。如果输入中提供聚类解决方案,金宝搏官方网站clusteringfunction.是空的。

CriterionName

用于聚类评估的标准的名称,存储为有效的标准名称。

CriterionValues

中每个建议簇数对应的判据值检查,存储为数值的向量。

检查

计算标准值的建议群集合的数量列表,存储为正整数值的向量。

失踪

用于排除数据的逻辑标志,存储为逻辑值的列向量。如果失踪=真正的,然后在数据矩阵中的相应值X不在集群解决方案中使用。

numobservations.

数据矩阵中的观测次数X,减去丢失的数量()值X,存储为正整数值。

优惠

集群的最佳数量,存储为正整数值。

最优基础

对应的最优聚类解优惠,存储为正整数值的列向量。如果输入中提供聚类解决方案,金宝搏官方网站最优基础是空的。

X

用于聚类的数据,以数值矩阵的形式存储。

方法

继承的方法

addK 评估集群的其他数量
紧凑的 紧凑聚类评价对象
阴谋 绘制聚类评价对象标准值

例子

全部折叠

用Davies-Bouldin聚类评价准则评价最优聚类数。

生成包含从具有不同参数值的三个多变量分布的随机数的样本数据。

rng (“默认”);%的再现性Mu1 = [2 2];Sigma1 = [0.9 -0.0255;-0.0255 - 0.9);Mu2 = [5 5];Sigma2 = [0.5 0;0 0.3);Mu3 = [-2, -2];Sigma3 = [1 0;0 0.9);N = 200; X = [mvnrnd(mu1,sigma1,N);......mvnrnd(mu2,sigma2,n);......mvnrnd(mu3,sigma3,n)];

使用Davies-Bouldin标准评估最佳簇数。使用数据kmeans

E = evalclusters (X,“kmeans”“DaviesBouldin”“中”,[1:6])
E = DaviesBouldineValuation具有属性:NumObServations:600检验:[1 2 3 4 5 6]标准值:[NaN 0.4663 0.4454 0.8316 1.0444 0.9236] Optimalk:3

优惠值表示,基于Davies-Bouldin标准,最佳群集数是三个。

绘制测试的每个簇数的Davies-Bouldin标准值。

数字;情节(e)

图中包含一个轴。轴包含2个类型的型号。

从图中可以看出,三个聚类的Davies-Bouldin值最低,说明最优聚类数为3。

创建分组的散点图,以在视觉上检查建议的群集。

数字;G箭头(x(:,1),x(:,2),e.optimaly,“篮板”'XOD'

图中包含一个轴。坐标轴包含3个类型为line的对象。这些物体代表1 2 3。

该图在数据中显示了三个不同的群集:群集1位于左下角,群集2位于右上角,群集3靠近绘图中心。

更多关于

全部展开

参考文献

戴维斯,D. L.和D. W. Bouldin。“群集分离措施。”IEEE模式分析与机器智能汇刊.卷。PAMI-1,1979年第2号PP。224-227。