evalclusters
评估的集群解决方案金宝搏官方网站
描述
例子
使用Calinski-Harabasz标准评估集群解决方案
评估最优数量的集群使用Calinski-Harabasz集群评价标准。
加载示例数据。
负载fisheriris
数据包含的萼片和花瓣长度和宽度测量三种虹膜花。
评估最优数量的集群使用Calinski-Harabasz标准。集群的数据使用kmeans
。
rng (“默认”)%的再现性伊娃= evalclusters(量,“kmeans”,“CalinskiHarabasz”,“中”1:6)
伊娃= CalinskiHarabaszEvaluation属性:NumObservations: 150 InspectedK: (1 2 3 4 5 6) CriterionValues:[南513.9245 561.6278 530.4871 456.1279 469.5068]OptimalK: 3
的OptimalK
值表示,基于Calinski-Harabasz标准,最优数量的集群是三。
评估一个矩阵的集群解决方案金宝搏官方网站
使用一个输入矩阵提出了集群解决方案评估最优数量的集群。金宝搏官方网站
加载示例数据。
负载fisheriris;
数据包含的萼片和花瓣长度和宽度测量三种虹膜花。
使用kmeans
创建一个输入矩阵提出的集群解决方案的花萼长度测量,使用1,2,3,4,5,6集群。金宝搏官方网站
clust = 0(大小(量,1),6);为i = 1:6 clust (:, i) = kmeans(量,我,“emptyaction”,“单”,…“复制”5);结束
每一行的clust
对应于一个花萼长度测量。每个六列对应于一个包含1到6集群的集群解决方案。
评估最优数量的集群使用Calinski-Harabasz标准。
伊娃= evalclusters (clust量,“CalinskiHarabasz”)
伊娃= CalinskiHarabaszEvaluation属性:NumObservations: 150 InspectedK: (1 2 3 4 5 6) CriterionValues:[南513.9245 561.6278 530.4871 456.1279 469.5068]OptimalK: 3
的OptimalK
值表示,基于Calinski-Harabasz标准,最优数量的集群是三。
指定函数处理的聚类算法
使用一个函数处理指定聚类算法,然后评估最优数量的集群。
加载示例数据。
负载fisheriris;
数据包含的萼片和花瓣长度和宽度测量三种虹膜花。
使用一个函数处理指定聚类算法。
myfunc = @ (X, K) (kmeans (X, K,“emptyaction”,“单”,…“复制”5));
评估的最优数量的集群使用Calinski-Harabasz花萼长度数据标准。
伊娃= evalclusters (myfunc量,“CalinskiHarabasz”,…“中”[1:6])
伊娃= CalinskiHarabaszEvaluation属性:NumObservations: 150 InspectedK: (1 2 3 4 5 6) CriterionValues:[南513.9245 561.6278 530.4871 456.1279 469.5068]OptimalK: 3
的OptimalK
值表示,基于Calinski-Harabasz标准,最优数量的集群是三。
输入参数
x
- - - - - -输入数据
矩阵
输入数据,指定为一个N——- - - - - -P矩阵。N是观测的数量,和P是变量的数量。
数据类型:单
|双
clust
- - - - - -聚类算法
“kmeans”
|“链接”
|“gmdistribution”
|矩阵的集群解决方案金宝搏官方网站|函数处理
聚类算法,指定为以下之一。
“kmeans” |
集群中的数据x 使用kmeans 聚类算法,“EmptyAction” 设置为“单” 和“复制” 设置为5 。 |
“链接” |
集群中的数据x 使用clusterdata 烧结的聚类算法,“链接” 设置为“病房” 。 |
“gmdistribution” |
集群中的数据x 使用gmdistribution 高斯混合分布算法“SharedCov” 设置为真正的 和“复制” 设置为5 。 |
如果标准
是“CalinskiHarabasz”
,“DaviesBouldin”
,或“剪影”
,您可以指定一个聚类算法使用函数处理。函数必须的形式C = clustfun(数据、K)
,在那里数据
是数据集中,K
是集群的数量。的输出clustfun
必须是下列之一:
一个整数向量代表集群指数每观察
数据
。必须有K
独特的价值观在这个向量。一个数字n——- - - - - -K的得分矩阵n观察和K类。在这种情况下,集群指数对每个观察确定每一行最大的得分值。
如果标准
是“CalinskiHarabasz”
,“DaviesBouldin”
,或“剪影”
,您还可以指定clust
作为一个n——- - - - - -K矩阵包含提出的集群解决方案。金宝搏官方网站n的观测样本数据,然后呢K提出的集群解决方案的数量。金宝搏官方网站列j包含集群指数为每个N分j集群解决方案。
数据类型:单
|双
|字符
|字符串
|function_handle
标准
- - - - - -聚类评价标准
“CalinskiHarabasz”
|“DaviesBouldin”
|“差距”
|“剪影”
聚类评价标准,指定为以下之一。
“CalinskiHarabasz” |
创建一个CalinskiHarabaszEvaluation 聚类评价对象包含Calinski-Harabasz索引值。有关更多信息,请参见Calinski-Harabasz标准。 |
“DaviesBouldin” |
创建一个DaviesBouldinEvaluation 集群包含Davies-Bouldin索引值的评价对象。有关更多信息,请参见Davies-Bouldin标准。 |
“差距” |
创建一个GapEvaluation 集群评价对象包含值差距标准。有关更多信息,请参见空白值。 |
“剪影” |
创建一个SilhouetteEvaluation 集群评价对象包含轮廓值。有关更多信息,请参见轮廓的价值和标准。 |
名称-值参数
指定可选的双参数作为Name1 = Value1,…,以=家
,在那里的名字
参数名称和吗价值
相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。
R2021a之前,用逗号来分隔每一个名称和值,并附上的名字
在报价。
例子:“中”,[1:5],“距离”,“cityblock”
指定测试1,2,3,4,5集群使用街区距离度量。
距离
- - - - - -距离度量
“sqEuclidean”
(默认)|“欧几里得”
|“cityblock”
|向量|函数|……
用于计算的距离度量准则值,指定为逗号分隔组成的“距离”
和一个以下。
“sqEuclidean” |
平方欧氏距离 |
“欧几里得” |
欧氏距离。这个选项是无效的kmeans 聚类算法。 |
“cityblock” |
的绝对差异 |
的余弦 |
1 -之间的夹角的余弦值点(视为向量) |
“相关” |
1 -样本点之间的相关性(视为序列值) |
“汉明” |
不同比例的坐标。这个选项是唯一有效的轮廓 标准。 |
“Jaccard” |
不同比例的非零坐标。这个选项是唯一有效的轮廓 标准。 |
每个距离度量的详细信息,请参阅pdist
。
您还可以指定一个函数使用的距离度量函数处理。表单的功能必须的距离d2 = distfun (XI, XJ)
,在那里习
是1 -n向量对应一个单行的输入矩阵X
,XJ
是一个米2——- - - - - -n矩阵对应于多个行X
。distfun
必须返回一个米21的向量距离d2
,他的k元素之间的距离习
和XJ (k,:)
。
距离
只接受一个函数处理聚类算法clust
接受一个函数处理的距离度量。例如,kmeans
聚类算法不接受一个函数处理的距离度量。因此,如果您使用kmeans
算法,然后指定一个函数处理距离
,软件错误。
例子:“距离”,“欧几里得”
数据类型:单
|双
|字符
|字符串
|function_handle
ClusterPriors
- - - - - -每个集群的先验概率
“经验”
(默认)|“平等”
先验概率为每个集群中,指定为逗号分隔组成的“ClusterPriors”
和一个以下。
“经验” |
计算的集群解决方案的整体轮廓值平均轮廓值点。每个集群有助于整体轮廓价值比例大小。 |
“平等” |
计算的集群解决方案的整体轮廓值平均每个集群内所有点的轮廓值,然后平均这些值在所有集群。每个集群同样有助于整体轮廓值,无论其大小。 |
例子:“ClusterPriors”、“经验”
B
- - - - - -参考数据集的数量
One hundred.
(默认)|正整数的值
ReferenceDistribution
- - - - - -参考数据生成方法
主成分分析的
(默认)|“统一”
参考数据生成方法,指定为逗号分隔组成的“ReferenceDistributions”
和一个以下。
主成分分析的 |
生成参考数据均匀分布在一个箱与主成分的数据矩阵x 。 |
“统一” |
生成参考数据统一在每个特性的数据矩阵x 。 |
例子:“ReferenceDistribution”、“制服”
SearchMethod
- - - - - -方法选择最优数量的集群
“globalMaxSE”
(默认)|“firstMaxSE”
方法选择最优数量的集群,指定为逗号分隔组成的“SearchMethod”
和一个以下。
“globalMaxSE” |
评估每个提议的集群
在哪里K是集群的数量差距(K)的差距值集群解决方案K集群,GAPMAX是最大的差距值和SE (GAPMAX)是标准误差值对应于最大的差距。 |
“firstMaxSE” |
评估每个提议的集群
在哪里K是集群的数量差距(K)的差距值集群解决方案K集群和SE (K+ 1)的标准误差是集群解决方案K+ 1集群。 |
例子:“SearchMethod”、“globalMaxSE”
输出参数
伊娃
——聚类评价数据
聚类评价对象
聚类评价数据,作为聚类评价对象返回。
版本历史
介绍了R2013b
MATLAB命令
你点击一个链接对应MATLAB命令:
运行该命令通过输入MATLAB命令窗口。Web浏览器不支持MATLAB命令。金宝app
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。