Calinskiharabaszevaluation

Calinski-Harabasz标准聚类评估对象

描述

Calinskiharabaszevaluation是由样本数据组成的对象（X），聚类数据（最佳）和Calinski-Harabasz标准值（CriterionValues）用于评估最佳簇数（Optimalk）。Calinski-Harabasz标准有时称为方差比标准（VRC）。定义明确的集群具有较大的群间方差和群内差异。最佳簇数对应于最高的Calinski-Harabasz索引值的溶液。有关更多信息，请参阅Calinski-Harabasz标准。

创建

创建一个Calinski-Harabasz标准聚类评估对象评估器功能并指定标准为“ Calinskiharabasz”。

然后您可以使用袖珍的创建Calinski-Harabasz标准聚类评估对象的紧凑版本。该函数删除了属性的内容X，，，，最佳，和失踪。

特性

展开全部

聚类评估属性

`簇功能`-聚类算法
`'kmeans'`|`'连锁'`|`“ gmdistribution”`|功能句柄|`[]`

此属性仅阅读。

用于聚集样本数据的聚类算法，返回为'kmeans'，，，，'连锁'，，，，“ gmdistribution”，或函数句柄。如果将聚类解决方案指定为输入参数金宝搏官方网站评估器创建聚类评估对象时，然后簇功能是空的。

价值	描述
`'kmeans'`	将数据集中在`X`使用`Kmeans`聚类算法，带有`空功能`调成`“辛格尔顿”`和`重复`调成`5`。
`'连锁'`	将数据集中在`X`使用`clusterData`聚集聚类算法，带有`连锁`调成`“病房”`。
`“ gmdistribution”`	将数据集中在`X`使用`gmdistribution`高斯混合物分布算法，带有`ShareCov`调成`真的`和`重复`调成`5`。

数据类型：双倍的|char|function_handle

`CriterionName`-标准的名称
`'Calinskiharabasz'`

此属性仅阅读。

用于聚类评估的标准的名称，返回为'Calinskiharabasz'。

`CriterionValues`-标准值
数字向量

此属性仅阅读。

标准值，作为数字向量返回。每个值对应于建议的群集数量检验。

数据类型：双倍的

`检验`-拟议集群的数量列表
正整数矢量

此属性仅阅读。

为了计算标准值的拟议集群数量列表，作为正整数向量返回。

数据类型：双倍的

`Optimalk`-最佳簇数
正整数标量

此属性仅阅读。

最佳簇数，作为正整数标量返回。

数据类型：双倍的

`最佳`-最佳聚类解决方案
正整数柱向量|`[]`

此属性仅阅读。

对应于Optimalk，作为正整数柱向量返回。每一行最佳表示相应观察（或行）的群集索引X。如果将聚类解决方案指定为输入参数金宝搏官方网站评估器创建聚类评估对象或聚类评估对象时（请参阅袖珍的），然后最佳是空的。

数据类型：双倍的

样本数据属性

`失踪`-排除数据
逻辑列向量|`[]`

此属性仅阅读。

排除的数据，返回为逻辑列向量。如果是失踪是真的，然后在数据矩阵中的相应观察（或行）X在聚类解决方案中不使用。金宝搏官方网站如果聚类评估对象紧凑（请参阅袖珍的），然后失踪是空的。

数据类型：双倍的|逻辑

`数字`-观察次数
正整数标量

此属性仅阅读。

数据矩阵中的观察次数X，忽略缺失的观察结果（南）值，作为正整数标量返回。

数据类型：双倍的

`X`-用于聚类的数据
数字矩阵|`[]`

此属性仅阅读。

用于聚类的数据，返回为数字矩阵。行对应于观测值，列对应于变量。如果聚类评估对象紧凑（请参阅袖珍的），然后X是空的。

数据类型：单身的|双倍的

对象功能

`addk`	评估其他簇数量
`袖珍的`	紧凑的聚类评估对象
`阴谋`	绘图聚类评估对象标准值

例子

全部收缩

使用Calinski-Harabasz标准评估聚类解决方案

打开实时脚本

使用Calinski-Harabasz聚类评估标准评估最佳簇数。

加载渔业数据集。数据包含三种虹膜花的萼片和花瓣的长度和宽度测量。

加载渔业

使用Calinski-Harabasz标准评估最佳簇数。使用Kmeans。

rng（“默认”）％可再现性评估=评估器（MEAS，“ Kmeans”，，，，“ Calinskiharabasz”，，，，“ klist”，1：6）

评估=具有特性的Calinskiharabaszevaluation：NumObservations：150 tubsectedK：[1 2 3 4 5 6] CriterionValues：[NAN 513.9245 561.6278 561.6278 530.4871 456.1279 469.5068]最佳词：3

这Optimalk值表明，基于Calinski-Harabasz标准，最佳簇数为三个。

绘制每个测试簇的Calinski-Harabasz标准值。

情节（评估）

图包含一个轴对象。轴对象包含2个类型行的对象。

该图表明，最高的Calinski-Harabasz值出现在三个簇下，这表明最佳簇数为三个。

创建一个分组的散点图，以检查花瓣长度和宽度之间的关系。通过建议的簇对数据进行分组。

petallength = meas（：，3）;petalwidth = meas（：，4）;集群=评估。gScatter（petallength，petalwidth，簇，[]，，，“ xod”）；

图包含一个轴对象。轴对象包含3个类型行的对象。这些对象表示1、2、3。

该图显示了左下角的群集3，与其他两个簇完全分离。簇3包含花瓣宽度和长度最小的花朵。簇1位于右上角，其中包含花瓣宽度和长度最大的花朵。簇2位于情节的中心附近，并包含这两个极端之间的花朵。

参考

[1] Calinski，T。和J. Harabasz。“用于聚类分析的树突法。”统计中的通信。卷。3，第1号，1974年，第1-27页。

版本历史记录

在R2013B中引入

也可以看看

评估器|DaviesbouldineValuation|宣传|Silhouetteevaluation

Calinskiharabaszevaluation

描述

创建

特性

聚类评估属性

簇功能-聚类算法'kmeans'|'连锁'|“ gmdistribution”|功能句柄|[]

CriterionName-标准的名称'Calinskiharabasz'

CriterionValues-标准值数字向量

检验-拟议集群的数量列表正整数矢量

Optimalk-最佳簇数正整数标量

最佳-最佳聚类解决方案正整数柱向量|[]

样本数据属性

失踪-排除数据逻辑列向量|[]

数字-观察次数正整数标量

X-用于聚类的数据数字矩阵|[]

对象功能

例子

使用Calinski-Harabasz标准评估聚类解决方案

更多关于

Calinski-Harabasz标准

参考

版本历史记录

也可以看看

`簇功能`-聚类算法
`'kmeans'`|`'连锁'`|`“ gmdistribution”`|功能句柄|`[]`

`CriterionName`-标准的名称
`'Calinskiharabasz'`

`CriterionValues`-标准值
数字向量

`检验`-拟议集群的数量列表
正整数矢量

`Optimalk`-最佳簇数
正整数标量

`最佳`-最佳聚类解决方案
正整数柱向量|`[]`

`失踪`-排除数据
逻辑列向量|`[]`

`数字`-观察次数
正整数标量

`X`-用于聚类的数据
数字矩阵|`[]`