主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

クラスターの可視化と評価

データのクラスターをプロットおよびクラスターの最適数を評価

クラスター分析では,データ点の間の類似度に基づいてデータをグループに編成します。適切なクラスター数を示す自然な区分がデータに含まれている場合があります。また,自然な区分がデータに含まれていない場合や,自然な区分が不明な場合もあります。このような場合は,データをグループ化するために最適なクラスター数を決定します。

特定のクラスター数にデータがどの程度適合するかを調べるには,ギャップやシルエットなど各種の評価基準を使用してインデックス値を計算します。クラスターを可視化するには,系統樹プロットを作成して階層的なバイナリクラスターツリーを表示します。隣接する葉の間で類似度の合計が最大になるように,葉の順序を最適化します。各グループに複数の測定値があるグループ化されたデータの場合は,多変量分散分析(MANOVA)を使用して計算したグループの平均に基づいて系統樹プロットを作成します。

関数

すべて展開する

系统树图 系統樹
optimalleaforder 階層クラスタリングの最適な葉ノードの順序
manovacluster MANOVA後のグループ平均クラスターの系統樹
轮廓 シルエットプロット
evalclusters クラスタリングの解の評価
addK 追加クラスター数の評価
紧凑的 コンパクトクラスタリング評価オブジェクト
increaseB 参照データセットの増加
情节 クラスタリング評価オブジェクト基準値のプロット

クラス

CalinskiHarabaszEvaluation Calinski-Harabasz基準クラスタリング評価オブジェクト
DaviesBouldinEvaluation Davies-Bouldin基準クラスタリング評価オブジェクト
GapEvaluation ギャップ基準クラスタリング評価オブジェクト
SilhouetteEvaluation シルエット基準クラスタリング評価オブジェクト

トピック

クラスター評価

この例では,evalclustersを使用してクラスターを識別する方法を示します。