主要内容

集群评估

此示例显示如何识别Fisher虹膜数据中的群集。

装载Fisher的Iris数据集。

加载渔民x = meas;Y =分类(物种);

X是一个数字矩阵,包含两个150虹膜的花瓣测量。y是包含相应的IRIS物种的字符向量的单元阵列。

评估从1到10的多个簇。

Eva = Evallusters(x,'kmeans''calinskiharabasz''klist',1:10)
EVA = CalinskiharabaszEvaluation具有属性:NumObservations:150检测:[1 2 3 4 5 6 7 8 9 10]标准值:[1x10双] Optimalk:1

优惠值表示,基于Calinski-Harabasz标准,最佳群集数是三个。

可视化eva.查看每个群集数量的结果。

情节(EVA)

图包含轴。轴包含2个类型的型号。

大多数聚类算法需要先前了解群集数量。当此信息不可用时,使用群集评估技术基于指定的度量来确定数据中存在的群集数。

三个集群与数据中的三种物种一致。

类别(Y)
ans =.3x1细胞{'setosa'} {'versicolor'} {'virginica'}

计算用于可视化目的的数据的非负秩两个近似。

xRed = nnmf(x,2);

原始功能减少到两个功能。由于任何功能都没有负面,nnmf.还保证了这些功能是非负面的。

使用散点图在视觉上确认三个集群。

g箭牌(xRed(:,1),xRed(:,2),y)xlabel('第1栏')ylabel('第2栏') 网格

图包含轴。轴包含3个类型的线。这些对象代表Setosa,Versicolor,Virginica。

也可以看看

|