主要内容

集群可视化与评估

绘制数据的聚类图,并评估聚类的最佳数量

聚类分析根据数据点之间的相似性将数据组织成组。有时数据包含指示适当数量的集群的自然划分。其他时候,数据不包含自然划分,或自然划分未知。在这种情况下,您可以确定将数据分组的最佳集群数量。

为了确定数据与特定数量集群的契合程度,可以使用不同的评估标准(如缺口或轮廓)计算指标值。通过创建树形图来可视化集群,以显示分层的二叉集群树。优化叶片顺序,使相邻叶片之间的相似性和最大化。对于每一组有多个测量值的分组数据,根据使用多元方差分析(MANOVA)计算的组均值创建一个树形图。

功能

全部展开

系统树图 系统树图绘制
optimalleaforder 层次聚类的最优叶子排序
manovacluster MANOVA后群均值聚类的树状图
轮廓 轮廓图
evalclusters 评估的集群解决方案金宝搏官方网站
addK 评估额外的集群数量
紧凑的 紧凑聚类评价对象
increaseB 增加参考数据集
情节 绘制聚类评价对象准则值

CalinskiHarabaszEvaluation Calinski-Harabasz准则聚类评价对象
DaviesBouldinEvaluation Davies-Bouldin准则聚类评价对象
GapEvaluation Gap准则聚类评价对象
SilhouetteEvaluation 轮廓准则聚类评价对象

主题

集群评价

这个例子展示了如何通过使用evalclusters