主要内容

模糊c均值聚类中模糊重叠的调整

这个例子展示了如何在执行模糊c均值聚类时调整模糊重叠的数量。

创建一个随机数据集。为了重现性,将随机数生成器初始化为默认值。

rng (“默认”)数据= rand(100,2);

指定模糊划分矩阵指数。

M = [1.1 2.0 3.0 4.0];

指数的值为必须大于1,数值越小,模糊重叠程度越低。换句话说,就是方法1时,星团之间的边界变得更加清晰。

对于每个重叠指数:

  • 将数据聚类。

  • 将每个数据点分类到具有最高隶属度的集群中。

  • 找到具有最大隶属度值的数据点0.6.这些点的分类比较模糊。

  • 为了量化模糊重叠的程度,计算所有数据点的平均最大隶属度值。平均最大隶属度值越高,模糊重叠越少。

  • 绘制聚类结果。

I = 1:4群集数据。options = [M(i) NaN NaN 0];[centers,U] = fcm(data,2,options);分类数据点。maxU = max(U);index1 = find(U(1,:) == maxU);index = find(U(2,:) == maxU);查找最大隶属度值较低的数据点。index = find(maxU < 0.6);计算平均最大隶属度值。averageMax = mean(maxU);绘制结果。次要情节(2,2,我)情节(数据(index1, 1),数据(index1, 2),“ob”)举行情节(数据(index2, 1),数据(index2, 2),”或“)情节(数据(index3, 1),数据(index3, 2),“xk”“线宽”2)图(中心(1,1),中心(1、2),“xb”“MarkerSize”15岁的“线宽”3)图(中心(2,1),中心(2,2),“xr”“MarkerSize”15岁的“线宽”, 3)标题([' m = 'num2str (M (i)), Ave. Max。= 'num2str (averageMax 3)))结束

图中包含4个轴对象。轴对象1,标题M = 1.1, Ave. Max。= 0.981包含5个line类型的对象。轴对象2,标题M = 2, Ave. Max。= 0.791包含5个line类型的对象。轴对象3,标题M = 3, Ave. Max。= 0.677包含5个line类型的对象。轴对象4,标题M = 4, Ave. Max。= 0.62包含5个line类型的对象。

给定的数据点被分类到具有最高成员值的集群中,如所示maxU.的最大成员值0.5指示该点相等地属于两个群集。用黑色标记的数据点x最大会员值低于0.6.这些点的聚类成员具有更大程度的不确定性。

最大隶属度值越低的数据点越多,聚类结果的模糊重叠程度越高。平均最大隶属度值,averageMax,提供了重叠的定量描述。一个averageMax的价值1表示清晰的集群,值越小表示重叠越多。

另请参阅

相关的话题