主要内容

Calinskiharabaszevaluation

Calinski-Harabasz标准聚类评估对象

    描述

    Calinskiharabaszevaluation是由样本数据组成的对象(X),聚类数据(最佳)和Calinski-Harabasz标准值(CriterionValues)用于评估最佳簇数(Optimalk)。Calinski-Harabasz标准有时称为方差比标准(VRC)。定义明确的集群具有较大的群间方差和群内差异。最佳簇数对应于最高的Calinski-Harabasz索引值的溶液。有关更多信息,请参阅Calinski-Harabasz标准

    创建

    创建一个Calinski-Harabasz标准聚类评估对象评估器功能并指定标准为“ Calinskiharabasz”

    然后您可以使用袖珍的创建Calinski-Harabasz标准聚类评估对象的紧凑版本。该函数删除了属性的内容X,,,,最佳, 和失踪

    特性

    展开全部

    聚类评估属性

    此属性仅阅读。

    用于聚集样本数据的聚类算法,返回为'kmeans',,,,'连锁',,,,“ gmdistribution”,或函数句柄。如果将聚类解决方案指定为输入参数金宝搏官方网站评估器创建聚类评估对象时,然后簇功能是空的。

    价值 描述
    'kmeans' 将数据集中在X使用Kmeans聚类算法,带有空功能调成“辛格尔顿”重复调成5
    '连锁' 将数据集中在X使用clusterData聚集聚类算法,带有连锁调成“病房”
    “ gmdistribution” 将数据集中在X使用gmdistribution高斯混合物分布算法,带有ShareCov调成真的重复调成5

    数据类型:双倍的|char|function_handle

    此属性仅阅读。

    用于聚类评估的标准的名称,返回为'Calinskiharabasz'

    此属性仅阅读。

    标准值,作为数字向量返回。每个值对应于建议的群集数量检验

    数据类型:双倍的

    此属性仅阅读。

    为了计算标准值的拟议集群数量列表,作为正整数向量返回。

    数据类型:双倍的

    此属性仅阅读。

    最佳簇数,作为正整数标量返回。

    数据类型:双倍的

    此属性仅阅读。

    对应于Optimalk,作为正整数柱向量返回。每一行最佳表示相应观察(或行)的群集索引X。如果将聚类解决方案指定为输入参数金宝搏官方网站评估器创建聚类评估对象或聚类评估对象时(请参阅袖珍的), 然后最佳是空的。

    数据类型:双倍的

    样本数据属性

    此属性仅阅读。

    排除的数据,返回为逻辑列向量。如果是失踪真的,然后在数据矩阵中的相应观察(或行)X在聚类解决方案中不使用。金宝搏官方网站如果聚类评估对象紧凑(请参阅袖珍的), 然后失踪是空的。

    数据类型:双倍的|逻辑

    此属性仅阅读。

    数据矩阵中的观察次数X,忽略缺失的观察结果()值,作为正整数标量返回。

    数据类型:双倍的

    此属性仅阅读。

    用于聚类的数据,返回为数字矩阵。行对应于观测值,列对应于变量。如果聚类评估对象紧凑(请参阅袖珍的), 然后X是空的。

    数据类型:单身的|双倍的

    对象功能

    addk 评估其他簇数量
    袖珍的 紧凑的聚类评估对象
    阴谋 绘图聚类评估对象标准值

    例子

    全部收缩

    使用Calinski-Harabasz聚类评估标准评估最佳簇数。

    加载渔业数据集。数据包含三种虹膜花的萼片和花瓣的长度和宽度测量。

    加载渔业

    使用Calinski-Harabasz标准评估最佳簇数。使用Kmeans

    rng(“默认”%可再现性评估=评估器(MEAS,“ Kmeans”,,,,“ Calinskiharabasz”,,,,“ klist”,1:6)
    评估=具有特性的Calinskiharabaszevaluation:NumObservations:150 tubsectedK:[1 2 3 4 5 6] CriterionValues:[NAN 513.9245 561.6278 561.6278 530.4871 456.1279 469.5068]最佳词:3

    Optimalk值表明,基于Calinski-Harabasz标准,最佳簇数为三个。

    绘制每个测试簇的Calinski-Harabasz标准值。

    情节(评估)

    图包含一个轴对象。轴对象包含2个类型行的对象。

    该图表明,最高的Calinski-Harabasz值出现在三个簇下,这表明最佳簇数为三个。

    创建一个分组的散点图,以检查花瓣长度和宽度之间的关系。通过建议的簇对数据进行分组。

    petallength = meas(:,3);petalwidth = meas(:,4);集群=评估。gScatter(petallength,petalwidth,簇,[],,,“ xod”);

    图包含一个轴对象。轴对象包含3个类型行的对象。这些对象表示1、2、3。

    该图显示了左下角的群集3,与其他两个簇完全分离。簇3包含花瓣宽度和长度最小的花朵。簇1位于右上角,其中包含花瓣宽度和长度最大的花朵。簇2位于情节的中心附近,并包含这两个极端之间的花朵。

    更多关于

    展开全部

    参考

    [1] Calinski,T。和J. Harabasz。“用于聚类分析的树突法。”统计中的通信。卷。3,第1号,1974年,第1-27页。

    版本历史记录

    在R2013B中引入