clusterdata
从数据构建烧结的集群
描述
例子
找到从样本数据有限数量的集群
找到并可视化最多三个集群在一个随机生成的数据集使用两种不同的方法:
指定一个值
截止
输入参数。指定一个值
“MaxClust”
名称-值对的论点。
创建一个示例数据集组成的随机生成的数据从三个标准统一的分布。
rng (“默认”);%的再现性X =[画廊(“uniformdata”3 [10]12);…画廊(“uniformdata”3 [10]13)+ 1.2;…画廊(“uniformdata”3 [10]14)+ 2.5);y = [(10,1); 2 * ((10, 1)); 3 * ((10, 1))];%的实际类
创建一个数据的散点图。
scatter3 (X (: 1) X (:, 2), X(:, 3), 100年,y,“填充”)标题(“三个集群随机生成的数据”);
找到一个最大的三个集群的数据通过指定值3截止
输入参数。
T1 = clusterdata (X, 3);
因为的价值截止
大于2,clusterdata
解释截止
作为集群的最大数量。
绘制数据和由此产生的集群作业。
scatter3 (X (: 1) X (:, 2), X(:, 3), 100年,T1,“填充”)标题(聚类的结果);
找到一个最大的三个集群通过指定值3“MaxClust”
名称-值对的论点。
T2 = clusterdata (X,“Maxclust”3);
绘制数据和由此产生的集群作业。
scatter3 (X (: 1) X (:, 2), X(:, 3), 100年,T2,“填充”)标题(聚类的结果);
使用这两种方法,clusterdata
识别的三个不同的集群数据。
创建和集群层次树
创建一个层次聚类树,找到集群在一个步骤。使用三维散点图可视化集群。
创建一个20000 -,- 3矩阵的示例数据生成标准的均匀分布。
rng (“默认”);%的再现性X =兰德(20000 3);
找到一个最大的四层次聚类树使用的创建病房
联系方法。指定“SaveMemory”
作为“上”
构建集群没有计算距离矩阵。否则,你可以得到一个内存不足错误如果你的机器没有足够的内存来保存的距离矩阵。
T = clusterdata (X,“链接”,“病房”,“SaveMemory”,“上”,“Maxclust”4);
图中所示的数据与每个集群不同的颜色。
scatter3 (X (: 1) X (:, 2), X (:, 3), 10 T)
clusterdata
识别四个集群数据。
输入参数
X
- - - - - -输入数据
数字矩阵
输入数据,指定为一个数字矩阵的两个或两个以上的行。行代表的观察,和列代表类别或维度。
数据类型:单
|双
名称-值参数
指定可选的双参数作为Name1 = Value1,…,以=家
,在那里的名字
参数名称和吗价值
相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。
R2021a之前,用逗号来分隔每一个名称和值,并附上的名字
在报价。
例子:clusterdata (X,“联系”,“病房”,“MaxClust”, 3)
指定创建一个最大的三个集群X
使用沃德联系。
截止
- - - - - -截止准则不一致或距离
积极的标量
距离
- - - - - -距离度量
“欧几里得”
(默认)|“squaredeuclidean”
|“seuclidean”
|“mahalanobis”
|函数处理|……
距离度量,指定为逗号分隔组成的“距离”
并接受任何距离度量pdist
如下表函数,望见。当你指定“距离”
,您还必须指定一个值MaxClust
或截止
。
度规 | 描述 |
---|---|
“欧几里得” |
欧氏距离(默认) |
“squaredeuclidean” |
平方欧氏距离。(此选项仅供效率。它不满足三角不等式)。 |
“seuclidean” |
标准化的欧氏距离。每个坐标差异观察是通过除以相应的扩展元素的标准差, |
“mahalanobis” |
而使用的样本协方差距离 |
“cityblock” |
城市街区的距离 |
闵可夫斯基的 |
闵可夫斯基距离。默认的指数是2。使用不同的指数 |
“chebychev” |
Chebychev距离(最大坐标差异) |
的余弦 |
1 -之间的夹角的余弦值点(视为向量) |
“相关” |
1 -样本点之间的相关性(视为序列值) |
“汉明” |
汉明距离,协调不同的百分比 |
“jaccard” |
1 - Jaccard系数,非零坐标不同的百分比 |
“枪兵” |
1 -样本之间的斯皮尔曼等级相关的观察(视为序列值) |
@ |
自定义距离函数处理。距离函数的形式 函数ZJ D2 = distfun(子)%计算距离…
如果您的数据并不是稀疏的,使用一个内置的 |
有关更多信息,请参见距离度量。
例子:clusterdata (X,‘距离’,‘闵可夫斯基’,‘MaxClust’, 4)
数据类型:字符
|字符串
|function_handle
链接
- - - - - -算法计算集群之间的距离
“平均”
|“重心”
|“完成”
|“中值”
|“单一”
|“病房”
|“加权”
算法计算集群之间的距离,指定为逗号分隔组成的“链接”
和任何算法所接受链接
函数,如下表所述。当你指定“链接”
,您还必须指定一个值MaxClust
或截止
。
算法 | 描述 |
---|---|
“平均” |
未加权的平均距离(UPGMA) |
“重心” |
质心的距离(UPGMC),只适合欧几里得距离 |
“完成” |
最远的距离 |
“中值” |
加权质心距离(WPGMC),只适合欧几里得距离 |
“单一” |
最短的距离 |
“病房” |
内在的平方距离(最小方差算法),只适合欧几里得距离 |
“加权” |
加权平均距离(WPGMA) |
有关更多信息,请参见联系。
例子:clusterdata (X,‘联系’,‘中等’,‘MaxClust’, 4)
数据类型:字符
|字符串
MaxClust
- - - - - -最大数量的集群
正整数
SaveMemory
- - - - - -选择保存记忆
“上”
|“关闭”
选择保存记忆,指定为逗号分隔组成的“SaveMemory”
,要么“上”
或“关闭”
。当你指定“SaveMemory”
,您还必须指定一个值MaxClust
或截止
。
的“上”
设置的原因clusterdata
构建集群没有计算距离矩阵。的“上”
设置适用于满足这两个条件:
当这两个条件,默认值为“SaveMemory”
是“上”
如果X
有20列或更少,或者如果计算机没有足够的内存来存储矩阵的距离。否则,默认值为“SaveMemory”
是“关闭”
。
当“SaveMemory”
是“上”
,链接
运行时间维度的数量成正比(列数X
)。当“SaveMemory”
是“关闭”
,链接
内存需求成正比N2
,在那里N
是观测的数量。选择最好的(最少)设置“SaveMemory”
取决于问题的维度,观察,可用内存。默认的“SaveMemory”
设置一个粗略的近似最优的设置。
例子:“SaveMemory”,“上”
数据类型:字符
|字符串
提示
算法
版本历史
Abrir比如
这种版本modificada德埃斯特比如。害怕Desea abrir埃斯特比如con sus modificaciones吗?
第一de MATLAB
Ha事实clic en联合国围绕此时一个埃斯特第一de MATLAB:
Ejecute el第一introduciendolo en la ventana de第一de MATLAB。洛杉矶navegadores网络没有admiten第一de MATLAB。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。