ドキュメンテーション

最新のはこのページがまだれていませ。。このページ最新は英语ご覧になれます。

连锁

凝集型のクラスターツリー

构文

z =链接(x)
z =链接(x,方法)
Z =链接(X,方法,度量)
z =链接(x,方法,pdist_inputs)
z =链接(x,method,metric,'savememory',value)
z =链接(y)
z =链接(y,方法)

说明

z =链接(Xでは,実数行列Xの行阶层ツリーをエンコードする行列行列zを返します。

z =链接(X,,,,方法では,指定れた方法を使用てを作成ます。このとき,方法は,の距离测定方法をし。。。

z =链接(x,方法,,,,公制では,Xの行间距离を计算尺度尺度公制を使用てクラスタリングを実行し。。

z =链接(x,方法,,,,pdist_inputsでは,关数pdistにパラメーター渡します。,,Xの行间距离をする关数です。

z =链接(x,方法,,,,公制,,,,“ savemory',价值)では,价值'真的'の场合メモリ节约のアルゴリズムで,价值'错误的'のとき标准アルゴリズム使用します。

z =链接(yは,行列のベクトル表现yを使用し。yは,关数pdistで计算れ距离行列,または关数关数pdistの出力従った一般的な类似度にになります。

z =链接(y,,,,方法では,指定れた方法を使用てを作成ます。このとき,方法は,の距离测定方法をし。。。

入力引数

X

2行行列行観测をし列はまたは次元を表し。。

方法

クラスター间距离を计算。。

メソッド 说明
'平均'

重みのない距离(UPGMA)

“质心”

重心まで(UPGMC)。。距离のみててます。。

'完全的'

最长距离

“中位数”

重みのまでの(WPGMC)。。距离のみ适してい。。

'单身的'

最短距离

“病房”

内部(最小アルゴリズム)。。距离适してい。。

“加权”

重みのある距离(WPGMA)

既定:'单身的'

公制

关数pdistで受け入れあらゆる距离计量。

计量 说明
“欧几里得”

ユークリッド(既定の)。

'seuclidean'

标准化さ。。。ののの标差は,标准偏差偏差s =nanstd(X)の対応で除算ことによりスケーリングれ。。。sに别値をするには,d = pdist(x,'seuclidean',s)を使用し。

'城市街区'

市街地距离。

'Minkowski'

2ですはははですです。指数指定するに,,,<命令moreinfo =“ none”> d = pdist(x,'minkowski',p)を使用ます。ここ,,pは指数表す正スカラー値です。

'chebychev'

チェビシェフ(最大标差)。

'Mahalanobis'

南科夫によって计算さ,Xの共分散分散した距离ののの分散分散分散を距离距离をするにd = pdist(x,'mahalanobis',c)を使用ます。ここ行列行列Cは対称正定。

“余弦”

1からベクトル扱わ点ののの余弦引いた。。

'相关性'

1から値系列扱われるのの标本を引いた値

'spearman'

1から観测间标本の顺位相关(値のとして)をを引い。。

“锤”

异なる座标割合を示す。。

'jaccard'

1からジャカード数(异なる非座标割合)を引い値。。

カスタム距离关数

@を使用て指定する距离。。
d = pdist(x,@distfun)

距离关数のは

d2 = distFun(xi,xj)
でなければませ。引数は,,,行行行Xに対応しいるいるいる行行行列ベクトルxiと,复数のXに対応しいるm2行n列行列行列XJです。DISTFUNは任意行数をもつ行列XJを受け入ればなりませ。。DISTFUNは距离D2M2行行列を返さなけれなりませんここで,,,,番目番目のxiXJ(K,:)间の距离。

既定:“欧几里得”

pdist_inputs

关数pdistで受け入れパラメーターの配列。たとえば,公制Minkowskiに设定して5の指数使用する场合,pdist_inputs{'Minkowski',5}に设定し。

Savemory

'上'または'离开'のいずれの列。可能な场合,'上'を设定と距离行列计算せずに关数连锁でクラスター作成され。。Savemoryは,のに适用され。。

  • 连锁“质心”“中位数”,または“病房”である

  • 距离“欧几里得”(既定)である

Savemory'上'のときは,连锁の実行は,数(Xの列数)に比例ます。Savemory'离开'のときは,连锁に必要メモリ量は,n2に比例ます。ここ,,nは観测の数。そのため,Savemoryに(高速に)设定设定をする,の次元数数,観测観测の数および利用可能可能なななメモリメモリ量Savemoryの设定,な设定ラフな近似です。

既定:X20以下以下,コンピューター距离行列保存するの十分なメモリがないないにははは'上',それの场合には'离开'

y

关数pdistの出力同じの,距离の。。

  • 长M(M – 1)/2の行ベクトル,,行行X内ののペア対応します。

  • (2,1),(3,1),...,(m,1),(3,2),...,(m,2),...,(m,m,m – 1))の顺序整列した距离

yは,关数pdistの出力従うで,より一般非类似度行列になり。

出力引数

z

zは,(m-1)行3列のです。ででmは,データの観测。。z1列目列目列目列目,木ののにされるれるクラスターのインデックスインデックスを含ん含んででいますます。。。叶叶ノードノードmまでの付けます叶ノード,ので,,それより高いすべてのクラスタークラスターをを含んでいいz(i,:)に対応新しく作らた各クラスターはインデックスインデックスインデックスm+が割り当てられ。Z(i,1:2)は,クラスターm+2つつ要素クラスターインデックスをでいますクラスタリングツリーツリーの内部ノードに対応するするm-1个クラスターがし。。。Z(i,3)は,列z(i,:)2つのれるつのつのの连结距离を示し。。

30个个初期ノードががあり,,手顺手顺手顺手顺ででクラスターででクラスターとととととがが结合さされるれるととととと仮定仮定仮定しますますます。この时点时点时点ででのの距离距离距离z(12,:)[5,7,1.5]12 + 30 = 42 = 42にクラスタークラスター,,インデックスれれさささされたインデックス,,,,。。クラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスタークラスターははははははははははははははははクラスタークラスターははははクラスタークラスタークラスタークラスターはクラスタークラスタークラスターはクラスタークラスタークラスタークラスターはクラスター意味します。

すべて折りたたむ

クラスターのとクラスターの比较

标本データをます。

加载渔业

ウォード连结法し种类の情报をし,フィッシャーののアヤメのデータデータデータデータデータデータののののつのつのつのつのつのますます

z =链接(MEAS,“病房”,,,,“欧几里得”);c =群集(z,“ maxclust”,4);

3つがつの种类対応しいることをし。。

Crosstab(C,物种)
ans = 0 25 1 0 24 14 0 1 35 50 0 0

zの最初の行を表示。。。

firstFive = z(1:5,:)
FirstFive = 102.0000 143.0000 0 8.0000 40.0000 0.1000 1.0000 18.0000 0.1000 10.0000 10.0000 35.0000 0.1000 129.0000 133.0000 0.1000

zの系统を作成し。。

树状图(z)

データの化と结果プロットプロット

20,000件観测をもつデータをにしし。

RNG默认;%可再现性X = Rand(20000,3);

ウォードのをし阶层クラスターツリー作成します。

z =链接(x,“病房”,,,,“欧几里得”,,,,“ savemory',,,,'上');

Savemory'离开'に设定た使用するマシンに行列をためののなななメモリががないときは,メモリメモリ不足不足エラーエラーエラーエラーが

4グループグループクラスターし结果をプロットし。。

c =群集(z,“ maxclust”,4);STACT3(x(:,1),x(:,2),x(:,3),10,c)

详细

すべて折りたたむ

リンケージ

以下の,なメソッドによってされるのに使用ささます。

  • クラスターrは,クラスターpおよびから作成さます。

  • nrは,rのののになり。。。

  • XRIは,クラスターr一世番目のになります。

  • “単连”“最近”2つの,,,つのつのクラスターオブジェクトの最も距离を使用しし。。

    d (( r ,,,, s = 最小 (( d 一世 s t (( X r 一世 ,,,, X s j ,,,, 一世 (( 一世 ,,,, ... ,,,, n r ,,,, j (( 1 ,,,, ... ,,,, n s

  • “完全”“最远”2つの,,,つのつのクラスターオブジェクトの最も距离を使用しし。。

    d (( r ,,,, s = 最大限度 (( d 一世 s t (( X r 一世 ,,,, X s j ,,,, 一世 (( 1 ,,,, ... ,,,, n r ,,,, j (( 1 ,,,, ... ,,,, n s

  • “平均” 2つの,つのにおけるすべてオブジェクトペア间距离のの平均使用使用ます。。

    d (( r ,,,, s = 1 n r n s 一世 = 1 n r j = 1 n s d 一世 s t (( X r 一世 ,,,, X s j

  • “重心”ではでは,つのつの重心间の距离をし。。

    d (( r ,,,, s = X r - X s 2

    ここで,

    X r = 1 n r 一世 = 1 n r X r 一世

  • “メディアン”2つのつのののある重心のユークリッド距离使用し。。

    d (( r ,,,, s = X r - X s 2

    ここで, X r および X s s s s sの重み付き。およびおよび X r は次よう再帰的定义されます。

    X r = 1 2 (( X p + X

  • “ウォードの”はのを使用しますつまり,,,,つのつのつのクラスターとしとしとしてて,,,クラスタークラスター内内の二乘和のの総和のの増加増加です。。クラスター内二乘和二乘和二乘和は,クラスタークラスターの和としてれます。の合计は次のd(r,s)にに等しくなりますははははは连锁が使用するです。

    d (( r ,,,, s = 2 n r n s (( n r + n s X r - X s 2 ,,,,

    ここで,

    • 2 はユークリッド距离

    • X r および X s はr rおよびsの

    • nrnsはr rおよびsのの数数

    一部のにおいてウォード连结はははの数数rnsを使いませ。关数连锁2つのので,のでつのつののクラスター距离は距离と同じにに。。。

  • ““加重”ではではではつのつの间距离の计算再帰再帰ををを使用使用ししますおよびおよびおよび距离はのようにとs sのs s s sのと距离のとして定义さ。。。。

    d (( r ,,,, s = (( d (( p ,,,, s + d (( ,,,, s 2

ヒント

  • yが距离のベクトル表现,,链接(y)计算の速度低下するがあります。“质心”“中位数”,および“病房”メソッドの场合,连锁yがユークリッドどうを确认し。时间かかるを回避するするは,yではなくXを渡してください。

  • 质心および中位数メソッド,クラスターツリーを作成できます。はははは,,,クラスタークラスタークラスタークラスタークラスタークラスタークラスターつのつのつのつのつのつのつのつのののののののの结合结合结合结合结合结合からからからからからからからから番目番目番目のがががが既定方向描画た系统では,叶からルートノードパスパスはは下向き下向きににになりなります。これこれをを回避回避するするににはは,,别别ののののメソッドをしててててます。

    この場合、クラスター 1 とクラスター 3 が結合され新しいクラスターになっていますが、この新しいクラスターとクラスター 2 の間の距離はクラスター 1 とクラスター 3 の間の距離よりも短くなっています。このため、非単调なになります。

  • ツリーを表示关数树状图,クラスターポイントを割り当てる关数,不な测定を关数关数不一致,およびコーフェン相关系を计算する关数Cophenetなどを,そのの关数に出力zを提供するます。

R2006Aよりに导入导入

この情报役にましかか?