主要内容

轮廓

描述

例子

轮廓(X,clust)情节集群的剪影n——- - - - - -p输入数据矩阵X,考虑到集群任务clust每个点(观察)X

例子

轮廓(X,clust,距离)土地使用中指定的距离度量inter-point剪影距离

例子

轮廓(X,clust,距离,DistParameter)接受一个或多个额外的距离度量当你指定参数值距离作为一个自定义距离函数处理@distfun接受额外的参数值。

例子

年代=轮廓(___)返回轮廓值年代对于任何的输入参数组合在前面的语法没有策划集群剪影。

例子

(年代,h)=轮廓(___)情节的轮廓图处理并返回h除了轮廓值年代

例子

全部折叠

从集群创建轮廓图数据使用不同的距离度量。

生成随机样本数据。

rng (“默认”)%的再现性X = [randn (10, 2) + 3; randn (10, 2) 3);

创建一个数据的散点图。

散射(X (: 1), (2):,);标题(随机生成的数据的);

图包含一个坐标轴对象。轴与标题随机生成数据对象包含一个类型的对象分散。

散点图显示数据似乎被分成两个相等大小的集群。

使用数据分割成两个集群kmeans使用默认的平方欧氏距离度量。

clust = kmeans (X, 2);

clust包含集群指数的数据。

创建一个轮廓图从集群数据使用默认平方欧氏距离度量。

clust轮廓(X)

图包含一个坐标轴对象。坐标轴对象包含轮廓值,ylabel集群包含一个对象类型的酒吧。

轮廓图显示数据分成两个相等大小的集群。所有的点在两个集群拥有庞大的轮廓值(0.8或更高版本),表明集群是否很好地分开。

创建一个轮廓图从集群数据使用欧氏距离度量。

clust轮廓(X,“欧几里得”)

图包含一个坐标轴对象。坐标轴对象包含轮廓值,ylabel集群包含一个对象类型的酒吧。

轮廓图显示数据分成两个相等大小的集群。所有的点在两个集群拥有庞大的轮廓值(0.6或更高版本),表明集群是否很好地分开。

从集群数据计算轮廓值。

生成随机样本数据。

rng (“默认”)%的再现性X = [randn (10, 2) + 1; randn (10, 2) 1];

集群中的数据X基于绝对距离的差异用的总和kmeans

clust = kmeans (X 2“距离”,“cityblock”);

clust包含集群指数的数据。

集群计算轮廓值数据。指定的距离度量“cityblock”表明的kmeans聚类是基于绝对差异的总和。

s =轮廓(X, clust,“cityblock”)
s =20×10.0816 0.5848 0.1906 0.2781 0.3954 0.4050 0.0897 0.5416 0.6203 0.6664⋮

找到轮廓值集群数据使用自定义卡方距离度量。验证卡方距离度量相当于欧氏距离度量,但有一个可选的尺度参数。

生成随机样本数据。

rng (“默认”);%的再现性X = [randn (10, 2) + 3; randn (10, 2) 3);

集群中的数据X使用kmeans使用默认的平方欧氏距离度量。

clust = kmeans (X, 2);

找到轮廓值并创建一个轮廓图从集群数据使用欧氏距离度量。

[s、h] =轮廓(X, clust“欧几里得”)

图包含一个坐标轴对象。坐标轴对象包含轮廓值,ylabel集群包含一个对象类型的酒吧。

s =20×10.6472 0.7241 0.5682 0.7658 0.7864 0.6397 0.7253 0.7783 0.7054 0.7442⋮
h =图(1)性质:数量:1名称:“颜色:(1 1 1)位置:(348 376 583 437)单位:“像素”显示所有属性

卡方距离之间J维点xz

χ ( x , z ) = j = 1 J w j ( x j - - - - - - z j ) 2 ,

在哪里 w j 重量与尺寸有关吗j

为每个维度和指定卡方距离权重函数。距离函数必须:

  • 采取作为输入参数n——- - - - - -p输入数据矩阵X,一行X(例如,x)和一个比例(或重量)参数w

  • 计算距离x每一行的X

  • 返回一个向量的长度n。每个元素的向量之间的距离观察对应x和每一行对应的观测X

w = (0.4;0.6);%为插图设置任意的权重chiSqrDist = @ x, Z, w)√(((x Z) ^ 2) * w);

找到轮廓值使用自定义集群数据距离度量chiSqrDist

s1 =轮廓(X, clust chiSqrDist w)
s1 =20×10.6288 0.7239 0.6244 0.7696 0.7957 0.6688 0.7386 0.7865 0.7223 0.7572⋮

的重量尺寸设置为1chiSqrDist欧氏距离度量。找到轮廓值和验证他们的值是一样的年代

w2 = [1;1);s2 =轮廓(X, clust chiSqrDist w2);AreValuesEqual = isequal (s2, s)
AreValuesEqual =逻辑1

轮廓值是相同的年代s2

输入参数

全部折叠

输入数据,指定为一个数字矩阵的大小n——- - - - - -p。对应点,行和列对应坐标。

数据类型:|

集群作业,指定为一个分类变量,数字矢量,字符矩阵,字符串数组或单元阵列特征向量包含为每个点集群名称X

轮廓对待年代和空值clust作为缺失值,而忽略了相应的行X

数据类型:||字符|字符串|细胞|分类

距离度量,指定为一个特征向量,字符串标量,或函数句柄,这个表中描述。

度规 描述
“欧几里得”

欧氏距离

“sqEuclidean”

平方欧氏距离(默认)

“cityblock”

的绝对差异

的余弦

1 -之间的夹角的余弦值点(视为向量)

“相关”

1 -样本点之间的相关性(视为序列值)

“汉明”

不同比例的坐标

“Jaccard”

不同比例的非零坐标

向量 成对的数字行向量的距离,创造的pdist函数。X不是用在这种情况下,可以安全地将[]
@distfun

自定义距离函数处理。距离函数的形式

函数D = distfun (X0, X,DistParameter)%计算距离的…
在哪里

  • X0是一个1——- - - - - -p向量包含单点(观察)的输入数据矩阵X

  • X是一个n——- - - - - -p矩阵点。

  • DistParameter代表一个或多个额外的具体参数值@distfun

  • D是一个n——- - - - - -1距离向量,D (k)是观察之间的距离X0X (k,:)

有关更多信息,请参见距离度量

例子:的余弦

数据类型:字符|字符串|function_handle||

距离度量参数值,指定为一个积极的标量,数值向量,或数字矩阵。这个论点是有效的只有当你指定一个自定义距离函数处理@distfun接受一个或多个参数值除了输入参数X0X

例子:轮廓(X, clust distfun, p1, p2)在哪里p1p2额外的距离度量参数值吗@distfun

数据类型:|

输出参数

全部折叠

轮廓的价值观,作为一个返回n——- - - - - -1从向量的值11。轮廓值衡量相似点是点自己的集群中,点相比,在其他集群。值的范围从11。高轮廓值表示一个点匹配自己的集群,和其他集群很不相配。

数据类型:|

图处理,作为一个标量返回。可以使用图处理查询和修改图的属性。有关更多信息,请参见图的属性

更多关于

全部折叠

轮廓值

轮廓值为每个点的相似点与其他点在同一集群中,而在其他集群。

轮廓值年代点被定义为

年代 = ( b 一个 ) 马克斯 ( 一个 , b ) ,

在哪里一个平均距离吗th指向相同的集群中的其他点,b最小平均距离吗th点对点在不同的集群中,最小化的集群。如果th集群点是唯一的点,然后轮廓值年代设置为1。

轮廓值范围从1到1。高轮廓值表明,关键是匹配自己的集群,和其他集群很不相配。如果大多数点轮廓的价值很高,那么集群解决方案是合适的。如果许多点很低或负的轮廓值,那么集群解决方案可能过多或过少的集群。您可以使用轮廓值作为聚类指标评价标准与任何距离。

引用

[1]考夫曼L。,P. J. Rousseeuw.发现组织数据:介绍了聚类分析。新泽西州霍博肯:约翰·威利& Sons Inc ., 1990年。

版本历史

之前介绍过的R2006a