主要内容

addK

类:clustering.evaluation.ClusterCriterion
包:clustering.evaluation

评估额外的集群数量

语法

eva_out = addK (eva、中)

描述

eva_out= addK (伊娃返回一个聚类评估对象eva_out包含存储在输入对象中的求值数据伊娃,并提供更多的评估数据,以供参考

输入参数

全部展开

聚类评价数据,指定为聚类评价对象。使用evalclusters

要计算的附加簇数,指定为正整数值的向量。如果在与已在输入对象中评估的聚类解决方案重叠金宝搏官方网站伊娃,然后addK忽略重叠的值。

输出参数

全部展开

更新的聚类评估数据,作为聚类评估对象返回。eva_out包含输入聚类评价对象中所包含的聚类方案的数据金宝搏官方网站伊娃,以及在

对于所有聚类评价对象类,addK更新InspectedKCriterionValues属性中指定的建议集群解决方案金宝搏官方网站和相应的标准值。addK也可以更新OptimalK最适条件属性来反映新的最优聚类个数和最优聚类解。

对于某些聚类评估对象类,addK还可能更新以下附加属性值:

  • 对于间隙评估对象-LogWExpectedLogWStdLogW,SE

  • 对于轮廓评价对象-ClusterSilhouettes

例子

全部展开

使用evalclusters,然后用addK以评估额外的集群数量。

加载示例数据。

负载fisheriris

数据包括三种鸢尾花的萼片和花瓣的长度和宽度的测量。

群集花测量数据使用kmeans,并使用Calinski-Harabasz标准来评估从一个到五个集群的建议解决方案。金宝搏官方网站

伊娃= evalclusters(量,“kmeans”“calinski”“中”1:5)
eva = CalinskiHarabaszEvaluation with properties: NumObservations: 150 InspectedK: [1 2 3 45] criteria values: [Inf 513.9245 561.6278 530.4871 456.1279] OptimalK: 1

聚类评价对象伊娃包含每个建议的集群解决方案的数据。的返回值OptimalK表示最优解决方案是三个集群。

使用相同的标准评估6到10个集群的建金宝搏官方网站议解决方案。将这些评估添加到原始的聚类评估对象中伊娃

伊娃= addK(伊娃,6:10)
eva = CalinskiHarabaszEvaluation with properties: NumObservations: 150 InspectedK: [1 2 3 4 5 6 7 8 9 10] criteria values: [1x10 double] OptimalK: 1

的更新值InspectedKCriterionValues表明,伊娃现在评估1到10个集群的建议解决方案。金宝搏官方网站的OptimalK价值仍然等于3.,表明三个集群仍然是最优解决方案。