轮廓
轮廓图
描述
轮廓(
接受一个或多个额外的距离度量当你指定参数值X
,clust
,距离
,DistParameter
)距离
作为一个自定义距离函数处理@
接受额外的参数值。distfun
例子
创建轮廓图
从集群创建轮廓图数据使用不同的距离度量。
生成随机样本数据。
rng (“默认”)%的再现性X = [randn (10, 2) + 3; randn (10, 2) 3);
创建一个数据的散点图。
散射(X (: 1), (2):,);标题(随机生成的数据的);
散点图显示数据似乎被分成两个相等大小的集群。
使用数据分割成两个集群kmeans
使用默认的平方欧氏距离度量。
clust = kmeans (X, 2);
clust
包含集群指数的数据。
创建一个轮廓图从集群数据使用默认平方欧氏距离度量。
clust轮廓(X)
轮廓图显示数据分成两个相等大小的集群。所有的点在两个集群拥有庞大的轮廓值(0.8或更高版本),表明集群是否很好地分开。
创建一个轮廓图从集群数据使用欧氏距离度量。
clust轮廓(X,“欧几里得”)
轮廓图显示数据分成两个相等大小的集群。所有的点在两个集群拥有庞大的轮廓值(0.6或更高版本),表明集群是否很好地分开。
计算轮廓值
从集群数据计算轮廓值。
生成随机样本数据。
rng (“默认”)%的再现性X = [randn (10, 2) + 1; randn (10, 2) 1];
集群中的数据X
基于绝对距离的差异用的总和kmeans
。
clust = kmeans (X 2“距离”,“cityblock”);
clust
包含集群指数的数据。
集群计算轮廓值数据。指定的距离度量“cityblock”
表明的kmeans
聚类是基于绝对差异的总和。
s =轮廓(X, clust,“cityblock”)
s =20×10.0816 0.5848 0.1906 0.2781 0.3954 0.4050 0.0897 0.5416 0.6203 0.6664⋮
找到轮廓值使用自定义距离度量
找到轮廓值集群数据使用自定义卡方距离度量。验证卡方距离度量相当于欧氏距离度量,但有一个可选的尺度参数。
生成随机样本数据。
rng (“默认”);%的再现性X = [randn (10, 2) + 3; randn (10, 2) 3);
集群中的数据X
使用kmeans
使用默认的平方欧氏距离度量。
clust = kmeans (X, 2);
找到轮廓值并创建一个轮廓图从集群数据使用欧氏距离度量。
[s、h] =轮廓(X, clust“欧几里得”)
s =20×10.6472 0.7241 0.5682 0.7658 0.7864 0.6397 0.7253 0.7783 0.7054 0.7442⋮
h =图(1)性质:数量:1名称:“颜色:(1 1 1)位置:(348 376 583 437)单位:“像素”显示所有属性
卡方距离之间J
维点x和z是
在哪里 重量与尺寸有关吗j。
为每个维度和指定卡方距离权重函数。距离函数必须:
采取作为输入参数n——- - - - - -p输入数据矩阵
X
,一行X
(例如,x
)和一个比例(或重量)参数w
。计算距离
x
每一行的X
。返回一个向量的长度n。每个元素的向量之间的距离观察对应
x
和每一行对应的观测X
。
w = (0.4;0.6);%为插图设置任意的权重chiSqrDist = @ x, Z, w)√(((x Z) ^ 2) * w);
找到轮廓值使用自定义集群数据距离度量chiSqrDist
。
s1 =轮廓(X, clust chiSqrDist w)
s1 =20×10.6288 0.7239 0.6244 0.7696 0.7957 0.6688 0.7386 0.7865 0.7223 0.7572⋮
的重量尺寸设置为1chiSqrDist
欧氏距离度量。找到轮廓值和验证他们的值是一样的年代
。
w2 = [1;1);s2 =轮廓(X, clust chiSqrDist w2);AreValuesEqual = isequal (s2, s)
AreValuesEqual =逻辑1
轮廓值是相同的年代
和s2
。
输入参数
X
- - - - - -输入数据
数字矩阵
输入数据,指定为一个数字矩阵的大小n——- - - - - -p。对应点,行和列对应坐标。
数据类型:单
|双
clust
- - - - - -集群的任务
分类变量|数值向量|字符矩阵|字符串数组|单元阵列的特征向量
集群作业,指定为一个分类变量,数字矢量,字符矩阵,字符串数组或单元阵列特征向量包含为每个点集群名称X
。
轮廓
对待南
年代和空值clust
作为缺失值,而忽略了相应的行X
。
数据类型:单
|双
|字符
|字符串
|细胞
|分类
距离
- - - - - -距离度量
“sqEuclidean”
(默认)|“欧几里得”
|“cityblock”
|函数处理|向量的成对的距离|……
距离度量,指定为一个特征向量,字符串标量,或函数句柄,这个表中描述。
度规 | 描述 |
---|---|
“欧几里得” |
欧氏距离 |
“sqEuclidean” |
平方欧氏距离(默认) |
“cityblock” |
的绝对差异 |
的余弦 |
1 -之间的夹角的余弦值点(视为向量) |
“相关” |
1 -样本点之间的相关性(视为序列值) |
“汉明” |
不同比例的坐标 |
“Jaccard” |
不同比例的非零坐标 |
向量 | 成对的数字行向量的距离,创造的pdist 函数。X 不是用在这种情况下,可以安全地将[] 。 |
@ |
自定义距离函数处理。距离函数的形式 函数D = distfun (X0, X,
|
有关更多信息,请参见距离度量。
例子:的余弦
数据类型:字符
|字符串
|function_handle
|单
|双
DistParameter
- - - - - -距离度量参数值
积极的标量|数值向量|数字矩阵
距离度量参数值,指定为一个积极的标量,数值向量,或数字矩阵。这个论点是有效的只有当你指定一个自定义距离函数处理@
接受一个或多个参数值除了输入参数distfun
X0
和X
。
例子:轮廓(X, clust distfun, p1, p2)
在哪里p1
和p2
额外的距离度量参数值吗@
distfun
数据类型:单
|双
输出参数
更多关于
轮廓值
轮廓值为每个点的相似点与其他点在同一集群中,而在其他集群。
轮廓值年代我为我点被定义为
在哪里一个我平均距离吗我th指向相同的集群中的其他点我,b我最小平均距离吗我th点对点在不同的集群中,最小化的集群。如果我th集群点是唯一的点,然后轮廓值年代我设置为1。
轮廓值范围从1到1。高轮廓值表明,关键是匹配自己的集群,和其他集群很不相配。如果大多数点轮廓的价值很高,那么集群解决方案是合适的。如果许多点很低或负的轮廓值,那么集群解决方案可能过多或过少的集群。您可以使用轮廓值作为聚类指标评价标准与任何距离。
引用
[1]考夫曼L。,P. J. Rousseeuw.发现组织数据:介绍了聚类分析。新泽西州霍博肯:约翰·威利& Sons Inc ., 1990年。
版本历史
之前介绍过的R2006a
Apri esempio
如果dispone di una versione modificata di questo esempio。Desideri aprire questo esempio con le modifiche星期二吗?
第一MATLAB
海脂肪clic苏联合国collegamento切corrisponde questo第一MATLAB:
Esegui il第一inserendolo所以nella隙缝di第一MATLAB。我浏览器web非supportano金宝app comandi MATLAB。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。