集群评估

打开直播脚本

此示例显示如何识别Fisher虹膜数据中的群集。

装载Fisher的Iris数据集。

加载渔民x = meas;Y =分类（物种）;

X是一个数字矩阵，包含两个150虹膜的花瓣测量。y是包含相应的IRIS物种的字符向量的单元阵列。

评估从1到10的多个簇。

Eva = Evallusters（x，'kmeans'那'calinskiharabasz'那'klist'，1：10）

EVA = CalinskiharabaszEvaluation具有属性：NumObservations：150检测：[1 2 3 4 5 6 7 8 9 10]标准值：[1x10双] Optimalk：1

这优惠值表示，基于Calinski-Harabasz标准，最佳群集数是三个。

可视化eva.查看每个群集数量的结果。

情节（EVA）

图包含轴。轴包含2个类型的型号。

大多数聚类算法需要先前了解群集数量。当此信息不可用时，使用群集评估技术基于指定的度量来确定数据中存在的群集数。

三个集群与数据中的三种物种一致。

类别（Y）

ans =.3x1细胞{'setosa'} {'versicolor'} {'virginica'}

计算用于可视化目的的数据的非负秩两个近似。

xRed = nnmf（x，2）;

原始功能减少到两个功能。由于任何功能都没有负面，nnmf.还保证了这些功能是非负面的。

使用散点图在视觉上确认三个集群。

g箭牌（xRed（：，1），xRed（:,2），y）xlabel（'第1栏'）ylabel（'第2栏'） 网格在

图包含轴。轴包含3个类型的线。这些对象代表Setosa，Versicolor，Virginica。

也可以看看

下载电子书