主要内容

集群可视化与评价

绘制聚类数据并评估最优聚类数量

聚类分析根据数据点之间的相似性将数据组织成组。有时数据包含表示集群适当数量的自然划分。其他时候,数据不包含自然划分,或者自然划分未知。在这种情况下,需要确定分组数据的最佳集群数量。

为了确定数据是否适合特定数量的集群,可以使用不同的评估标准(如间隙或轮廓)计算索引值。通过创建树状图来显示层次二叉簇树来可视化集群。优化叶片,以最大限度地增加相邻叶片之间的相似性。对于每个组具有多个测量值的分组数据,创建基于使用多变量方差分析(MANOVA)计算的组平均值的树状图。

功能

全部展开

系统树图 系统树图绘制
optimalleaforder 层次聚类的最优叶片排序
manovacluster 组均值聚类的树状图
轮廓 轮廓图
evalclusters 评估的集群解决方案金宝搏官方网站
addK 评估集群的其他数量
紧凑的 紧凑聚类评价对象
increaseB 增加参考数据集
情节 绘制聚类评价对象标准值

CalinskiHarabaszEvaluation Calinski-Harabasz准则聚类评价对象
DaviesBouldinEvaluation Davies-Bouldin准则聚类评价对象
GapEvaluation 差距准则聚类评价对象
SilhouetteEvaluation 轮廓准则聚类评价对象

主题

集群评价

这个例子展示了如何使用evalclusters