此示例显示如何识别Fisher虹膜数据中的群集。
装载Fisher的Iris数据集。
加载渔民x = meas;Y =分类(物种);
X
是一个数字矩阵,包含两个150虹膜的花瓣测量。y
是包含相应的IRIS物种的字符向量的单元阵列。
评估从1到10的多个簇。
Eva = Evallusters(x,'kmeans'那'calinskiharabasz'那'klist',1:10)
EVA = CalinskiharabaszEvaluation具有属性:NumObservations:150检测:[1 2 3 4 5 6 7 8 9 10]标准值:[1x10双] Optimalk:1
这优惠
值表示,基于Calinski-Harabasz标准,最佳群集数是三个。
可视化eva.
查看每个群集数量的结果。
情节(EVA)
大多数聚类算法需要先前了解群集数量。当此信息不可用时,使用群集评估技术基于指定的度量来确定数据中存在的群集数。
三个集群与数据中的三种物种一致。
类别(Y)
ans =.3x1细胞{'setosa'} {'versicolor'} {'virginica'}
计算用于可视化目的的数据的非负秩两个近似。
xRed = nnmf(x,2);
原始功能减少到两个功能。由于任何功能都没有负面,nnmf.
还保证了这些功能是非负面的。
使用散点图在视觉上确认三个集群。
g箭牌(xRed(:,1),xRed(:,2),y)xlabel('第1栏')ylabel('第2栏') 网格在