文档

轮廓

语法

clust轮廓(X)
s =轮廓(X, clust)
[s、h] =轮廓(X, clust)
[…)=轮廓(X, clust度规)
[…]=轮廓(X, clust distfun, p1, p2,…)

描述

clust轮廓(X)情节集群的剪影n——- - - - - -p数据矩阵X集群定义为clust。行X对应点,列对应坐标。clust可以是类别变量,数字矢量,字符矩阵或单元阵列特征向量包含为每个点一个集群名称。轮廓对待年代或空的特征向量clust作为缺失值,忽略了相应的行X。默认情况下,轮廓使用点之间的平方欧氏距离X

s =轮廓(X, clust)返回轮廓值n1的向量年代,但没有阴谋集群剪影。

[s、h] =轮廓(X, clust)情节的轮廓,并返回轮廓值n1的向量年代,图处理h

[…)=轮廓(X, clust度规)块中指定的轮廓使用inter-point距离函数度规。选择度规在下表中给出。

度规 描述
“欧几里得”

欧氏距离

“sqEuclidean”

平方欧氏距离(默认)

“cityblock”

的绝对差异

的余弦

1 -之间的夹角的余弦值点(视为向量)

“相关”

1 -样本点之间的相关性(视为序列值)

“汉明”

不同比例的坐标

“Jaccard”

不同比例的非零坐标

向量

一个数字距离在上三角矩阵向量形式,例如是由pdist。X不是用在这种情况下,可以安全地将[]

每个指标的更多信息,请参阅距离度量

[…]=轮廓(X, clust distfun, p1, p2,…)接受一个函数处理distfun表单的一个度量

d = distfun (X0, X, p1, p2,…)

在哪里X0是一个1——- - - - - -p点,X是一个n——- - - - - -p矩阵点,p1, p2,……是可选的附加参数。这个函数distfun返回一个n——- - - - - -1向量d之间的距离X0和每一个点(行)X。的参数p1,p2,直接传递到函数distfun

例子

全部折叠

从集群数据创建一个轮廓图。

生成随机样本数据。

rng默认的%的再现性X = [randn (10, 2) + 1 (2); randn(10, 2)的(2)];

集群中的数据X使用kmeans

cidx = kmeans (X, 2);

从集群数据创建一个轮廓图。

轮廓(X, cidx)

从集群数据计算轮廓值。

生成随机样本数据。

rng默认的%的再现性X = [randn (10, 2) + 1 (2); randn(10, 2)的(2)];

使用kmeans集群中的数据X基于绝对差异距离的总和。

cidx = kmeans (X 2“距离”,“cityblock”);

集群计算轮廓值数据。指定度规作为“cityblock”表明的kmeans聚类是基于绝对差异的总和。

s =轮廓(X, cidx,“cityblock”)
s = 0.0816 0.5848 0.1906 0.2781 0.3954 0.4050 0.0897 0.5416 0.6203 0.6664 0.5814 0.6022 0.6540 0.5223 0.5566 0.4227 0.6225 0.6558 0.5284 0.6034

更多关于

全部折叠

轮廓值

每个点的轮廓值的相似点是点自己的集群,点相比其他集群。的轮廓值点,如果,被定义为

如果= (bi-ai) / max (ai, bi)

在哪里人工智能平均距离吗th指向相同的集群中的其他点,bi最小平均距离吗th点对点在不同的集群中,最小化在集群。

轮廓值范围从1 + 1。高轮廓值表示相配的自己的集群,并很不相配,邻近的集群。如果大多数点轮廓的价值很高,那么集群解决方案是合适的。如果许多点很低或负的轮廓值,那么集群解决方案可能要么过多或过少的集群。轮廓集群评价标准可用于任何距离度量。

引用

[1]考夫曼L。,P. J. Rousseeuw.发现组织数据:介绍了聚类分析。新泽西州霍博肯:约翰·威利& Sons Inc ., 1990年。

之前介绍过的R2006a

这个主题有帮助吗?