主要内容

OptimAlleafOrder.

分层群集的最佳叶排序

描述

例子

叶芽= Optimalaleaford(D.返回分层二进制群集树的最佳叶排序,,使用距离,D.。二进制树的最佳叶排序最大化相邻叶片之间的相似性之和通过翻转树枝而不划分簇。

叶芽= Optimalaleaford(D.名称,价值使用一个或多个名称值对参数返回最佳叶排序。

例子

全部收缩

使用分层二进制群集树使用连锁。然后,将树形图绘制与具有最佳叶排序的树木图进行比较。

生成示例数据。

RNG('默认'重复性的%x =兰特(10,2);

创建距离矢量和分层二进制群集树。使用距离和聚类树来确定最佳叶序。

d = pdist(x);树=联动(D,'平均');LEAFORDER = OPTEMALLEAFORDER(树,D);

用最佳叶子排序绘制Dendrogram和DendOrgram。

图()子图(2,1,1)树木(树)标题('默认叶订单')子图(2,1,2)树枝状图(树,'重新排序',叶滴当)标题('最佳叶订单'

图包含2个轴。带标题默认叶排序的轴1包含9个类型的线。带有标题最佳叶订单的轴2包含9个类型的线。

底部图中叶子的顺序对应于元素叶芽

叶芽
LEGORDER =.1×101 4 9 10 2 5 8 3 7 6

生成示例数据。

RNG('默认'重复性的%x =兰特(10,2);

创建距离矢量和分层二进制群集树。

d = pdist(x);树=联动(D,'平均');

使用逆距离相似度变换来确定最佳叶序。

Leaforder = Optimalaleaford(树,D,'转型''逆'
LEGORDER =.1×101 4 9 10 2 5 8 3 7 6

输入参数

全部收缩

分层二进制群集树,指定为(m- 1)-1)您使用的-3矩阵连锁, 在哪里m是叶子的数量。

确定叶子之间的相似度的距离,指定为矩阵或距离矢量。例如,您可以使用距离Pdist.

名称值对参数

指定可选的逗号分离对名称,价值论点。名称是参数名称和价值是相应的价值。名称必须出现在引号内。您可以以任何顺序指定多个名称和值对参数name1,value1,...,namen,valuen

例子:'标准','群体','转型','逆'指定使用逆相似性转换,指定在每个叶子和相邻簇中的所有其他叶子之间最大化的相似之处。

用于确定最佳叶排序的优化标准,指定为逗号分隔的对'标准'和其中一个值:

'邻近的' 最大化相邻叶子之间的相似之和。
'团体' 在树木图的相同水平上最大化每片叶片和相邻簇中的所有其他叶子之间的相似性的总和。

例子:'标准','群体'

将距离转换为相似性的方法,指定为逗号分隔的对组成'转型'一之一'线性''逆'或功能手柄。

D.我,J.SIM我,J.表示叶子之间的距离和相似性一世j, 分别。包含的相似性转换是:

'线性' SIM我,J.= max.我,J.D.我,J.) -D.我,J.
'逆' SIM我,J.= 1 /D.我,J.

要使用自定义转换功能,请将句柄指定为接受距离矩阵的函数,D.,并返回相似性的矩阵,S.。该功能应在距离值范围内单调减小。S.必须具有相同的尺寸D., 和s(i,j)是基于的相似性D(i,j)

例子:'转换',@ mytransform

输出参数

全部收缩

最佳叶序,作为长度返回 -m矢量,在那里m是叶子的数量。叶芽是矢量的排列1:M.,基于指定距离和相似性转换提供最佳叶排序。

参考

[1] Bar-Joseph,Z.,Gifford,D.K.和Jaakkola,T.S.(2001)。“用于分层聚类的快速最佳叶排序。”生物信息学卷。17,4:S22-9。PMID:11472989。

也可以看看

||

在R2012B中介绍