聚类分析根据数据点之间的相似性将数据组织成组。有时数据包含指示适当数量的集群的自然划分。其他时候,数据不包含自然划分,或自然划分未知。在这种情况下,您可以确定将数据分组的最佳集群数量。
为了确定数据与特定数量集群的契合程度,可以使用不同的评估标准(如缺口或轮廓)计算指标值。通过创建树形图来可视化集群,以显示分层的二叉集群树。优化叶片顺序,使相邻叶片之间的相似性和最大化。对于每一组有多个测量值的分组数据,根据使用多元方差分析(MANOVA)计算的组均值创建一个树形图。
CalinskiHarabaszEvaluation |
Calinski-Harabasz准则聚类评价对象 |
DaviesBouldinEvaluation |
Davies-Bouldin准则聚类评价对象 |
GapEvaluation |
Gap准则聚类评价对象 |
SilhouetteEvaluation |
轮廓准则聚类评价对象 |
这个例子展示了如何通过使用evalclusters
.