主要内容

不一致

不一致性系数

描述

示例

y=不一致(Z.返回层次簇树中每个链接的不一致系数Z.由这件生成联系功能。不一致通过将其高度与位于层次结构的相同级别的相同级别的相同级别进行比较,通过将其高度与其他链路的平均高度进行比较来计算每个链路的不一致系数。系数越大,链路连接的对象之间的差异越大。有关更多信息,请参阅算法

示例

y=不一致(Z.D.返回树中每个链接的不一致系数Z.通过搜索深度D.每个链接下面。

例子

崩溃

检查分层群集树的不一致系数计算。

加载examgrades数据集。

加载examgrades

创建一个层次集群树。

Z =连杆(成绩);

使用使用的不一致系数信息创建矩阵不一致.查看第84链接的信息。

Y =不一致(Z);y(84,:)
ans =.1×4.7.2741 0.3624 3.0000 0.5774

第四列y包含不一致系数,该系数使用的第一列的平均值计算y和第二列中的标准偏差y

因为行的行y对应于的行Z.,检查第84号链接Z.

Z(84年,:)
ans =.1×3.190.0000 203.0000 7.4833

第84个链接连接树中的190和203簇,并且具有高度7.4833.第190集群对应于索引的链接 190 - 120. = 70 ,其中120为观测次数。第203个集群对应第83个链路。

默认情况下,不一致使用两个级别的树来计算y.因此,只使用第70、83、84条链路来计算第84条链路的不一致系数。比较y(84,:)用相应的计算方法利用连杆的高度Z.

平均值84 =平均值([z(70,3)z(83,3)z(84,3)])
Mean84 = 7.2741.
STD84 = STD([Z(70,3)Z(83,3)Z(84,3)])
STD84 = 0.3624
不一致的84 =(z(84,3)-mean84)/ std84
不一致的84 = 0.5774

创建示例数据。

x =画廊('sublicatdata',[10 2],12);y = pdist(x);

生成层次集群树。

z =链接(y,“单身”);

生成分层群集树的树形图。

树木图(Z)

图包含轴。轴包含9个类型的类型。

将群集树z中的每个链路计算到深度3计算不一致系数。

w =不一致(z,3)
w =9×4.0.1313 0 1.0000 0 0.1386 0 1.0000 0 0.1463 0.0109 2.0000 0.7071 0.2391 1.0000 0 0 0.1951 0.0568 4.0000 0.9425 0.2308 0.0543 4.0000 0.9320 0.2395 0.0748 4.0000 0.7636 0.2654 0.0945 4.0000 0.9203 0.3769 0.0950 3.0000 1.1040

输入参数

崩溃

附分分层群集树,指定为返回的数字矩阵联系Z.是一个m- 1)- 3矩阵,在哪里m是观察人数。列1和2Z.包含以对链接的群集索引以形成二进制树。Z(I,3)包含在行合并的两个集群之间的链接距离z(我,:)

数据类型:单身|双人间

深度,指定为正整数标量。对于每个链接K.不一致使用内部树中的所有链路计算相应的不一致系数D.水平以下K.

数据类型:单身|双人间

输出参数

崩溃

不一致系数信息,作为一个返回m- 1)- 4矩阵,其中m- 1)行对应于行的行Z..此表描述了列y

描述

1

计算中包含的所有链路的高度的平均值

2

计算中包含的所有链路高度的标准偏差

3.

计算中包含的链接数

4.

不一致性系数

数据类型:双人间

算法

对于每个链接K.,不一致的系数计算为

y K. 4. = Z. K. 3. - y K. 1 / y K. 2

在哪里y是分层群集树中链接的不一致系数信息Z.

对于在它们下面没有进一步链接的链接,不一致系数设置为0。

参考文献

[1] jain,A.和R. Dubes。用于聚类数据的算法.上鞍河,新罕布什尔州:Prentice-Hall,1988年。

用于检测和描述格式塔簇的图论方法。计算机上的IEEE交易.C-20卷,第1期,1971年,68-86页。

之前介绍过的R2006a