主要内容

Iris数据的模糊c均值聚类

这个例子展示了如何使用模糊c均值聚类的虹膜数据集,这个数据集收集的植物学家埃德加·安德森和包含随机抽样的花属于三种虹膜花:setosa,多色的,virginica。为每个物种,花萼长度的数据集包含50个观测,萼片宽,花瓣长度和花瓣宽度。

加载数据

加载的数据集iris.dat数据文件。

负载iris.dat

分区数据分成三组setosa,多色的,virginica

setosaIndex =虹膜(:,5)= = 1;versicolorIndex =虹膜(:,5)= = 2;virginicaIndex =虹膜(:,5)= = 3;setosa =虹膜(setosaIndex:);杂色的=虹膜(versicolorIndex:);virginica =虹膜(virginicaIndex:);

在二维图数据

iris数据包含四个维度代表花萼长度,萼片宽,花瓣长度和花瓣宽度。画出两个维度的数据点为每个组合。

特点= {“花萼长度”,萼片宽的,“花瓣长度”,“花瓣宽度”};对= [1 2;1 3;1 - 4;2 3;2 - 4;3 4];我= 1:6 x =双(我,1);(y =对我,2);次要情节(2、3、我)情节([setosa (:, x)多色的(:,x) virginica (:, x)),[setosa (:, y)多色的(:,y) virginica (:, y)],“。”{x})包含(特征)ylabel(特征{y})结束

图包含6轴对象。坐标轴对象1包含3线类型的对象。坐标轴对象2包含3线类型的对象。坐标轴对象3包含3线类型的对象。坐标轴对象4包含3线类型的对象。坐标轴对象5包含3线类型的对象。坐标轴对象6包含3线类型的对象。

设置参数

指定的选项使用模糊c均值聚类数据集群。这些选项有:

  • 数控——数量的集群

  • M -模糊划分矩阵指数,这表明模糊集群重叠的程度。有关更多信息,请参见调整模糊重叠在模糊c均值聚类

  • 麦克斯特——最大迭代数。聚类过程停止后的迭代次数。

  • minImprove——最小的改进。聚类过程停止时连续两次迭代之间的目标函数的改进小于这个值。

数控= 3;M = 2.0;麦克斯特= 100;minImprove = 1 e-6;

关于这些选项的更多信息和模糊c均值算法,明白了fcm

计算集群

模糊c均值聚类是一个迭代的过程。最初,fcm函数生成一个随机模糊划分矩阵。这个矩阵表示每个数据点的隶属程度在每个集群。

在每个聚类迭代,fcm计算集群中心和更新模糊划分矩阵使用计算中心位置。然后,计算目标函数值。

集群的数据,显示每次迭代后的目标函数值。

clusteringOptions = [M麦克斯特minImprove真正];(中心、U) = fcm(数控虹膜clusteringOptions);
迭代数= 1,obj。fcn = 28838.424340迭代数= 2,obj。fcn迭代数= 3 = 21010.880067,obj。fcn = 15272.280943迭代数= 4,obj。fcn = 11029.756194迭代数= 5,obj。fcn迭代数= 10550.015503 = 6,obj。fcn = 10301.776800迭代数= 7,obj。fcn = 9283.793786迭代数= 8,obj。fcn = 7344.379868迭代数= 9,obj。fcn = 6575.117093迭代数= 10,obj。 fcn = 6295.215539 Iteration count = 11, obj. fcn = 6167.772051 Iteration count = 12, obj. fcn = 6107.998500 Iteration count = 13, obj. fcn = 6080.461019 Iteration count = 14, obj. fcn = 6068.116247 Iteration count = 15, obj. fcn = 6062.713326 Iteration count = 16, obj. fcn = 6060.390433 Iteration count = 17, obj. fcn = 6059.403978 Iteration count = 18, obj. fcn = 6058.988494 Iteration count = 19, obj. fcn = 6058.814438 Iteration count = 20, obj. fcn = 6058.741777 Iteration count = 21, obj. fcn = 6058.711512 Iteration count = 22, obj. fcn = 6058.698925 Iteration count = 23, obj. fcn = 6058.693695 Iteration count = 24, obj. fcn = 6058.691523 Iteration count = 25, obj. fcn = 6058.690622 Iteration count = 26, obj. fcn = 6058.690247 Iteration count = 27, obj. fcn = 6058.690092 Iteration count = 28, obj. fcn = 6058.690028 Iteration count = 29, obj. fcn = 6058.690001 Iteration count = 30, obj. fcn = 6058.689990 Iteration count = 31, obj. fcn = 6058.689985 Iteration count = 32, obj. fcn = 6058.689983 Iteration count = 33, obj. fcn = 6058.689983

聚类目标函数时停止改进低于指定的最低门槛。

绘制计算集群中心大胆的数字。

i = 1:6次要情节(2、3、我)j = 1:数控x =对(我,1);(y =对我,2);文本(中心(j, x)中心(j, y) int2str (j),“FontWeight”,“大胆”);结束结束

图包含6轴对象。轴1包含6行类型的对象,对象的文本。轴2包含6行类型的对象,对象的文本。轴3包含6行类型的对象,对象的文本。轴4包含6行类型的对象,对象的文本。轴5包含6行类型的对象,对象的文本。轴6包含6行类型的对象,对象的文本。

另请参阅

相关的话题