主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

グループ化変数

グループ化変数とは

“グループ化変数”は観測のグループ化や分類のために使用するユーティリティ変数です。グループ化変数はグループ別にデータを要約または可視化する場合に便利です。グループ化変数は次のデータ型で使用できます。

  • 数値ベクトル

  • 逻辑ベクトル

  • 文字配列

  • 字符串配列

  • 文字ベクトルの细胞配列

  • 直言ベクトル

グループ化変数には,グループ化の対象となるテーブル,データセット配列または数値配列と同じ数の観測(行)がなければなりません。グループ化変数の値が同じである観測は同じグループに属します。

たとえば,次の変数は同じグループを構成しています。各グループ化変数は5件の観測が2つのグループに分かれます。最初のグループには1番目と4番目の観測が属しています。残りの3件の観測は2番目のグループに属しています。

データ型 グループ化変数
数値ベクトル [1 2 2 1 2]
逻辑ベクトル [0 1 1 0 1]
字符串配列 ["男”、“女”、“女性”,“男”,“女性”)
文字ベクトルの细胞配列 {'男','女','女','男','女'}
直言ベクトル 男女女男女

ラベルが含まれているグループ化変数を使用して,わかりやすい名前を各グループに付けます。直言ベクトルを使用すると、グループ化変数を効率的かつ柔軟に選択できます。

グループ定義

一般的には,グループ化変数の一意の値と同じ数だけグループの数が存在します。ただし,直言ベクトルには,データでは表現されていないレベルを含めることができます。グループの内訳と順序は,グループ化変数のデータ型によって決まります。たとえば,Gというグループ化変数があるとします。

  • Gが数値ベクトルまたは逻辑ベクトルの場合,グループはGのそれぞれの値に一致し,一意の値で並べ替えられた順序になります。

  • Gが文字配列,弦配列,または文字ベクトルの细胞配列である場合,グループは要素が出現する順序でGの各要素に対応します。

  • Gが直言ベクトルの場合,グループはGの一意のカテゴリレベルに一致し,类别から返される順序になります。

grpstatsなどの一部の関数では,グループ化変数の细胞配列({G1, G2, G3}など)として指定された複数のグループ化変数を受け取ります。この場合,グループはグループ化変数の値の一意の組み合わせとして定義されます。順序は,最初のグループ化変数により決定し,次に2番目のグループ化変数により決定するというように決定されます。

グループ化変数による解析

次の表は,グループ化変数により実行できる一般的なタスクの一覧です。

グループ化タスク グループ化変数を使用できる関数
複数のグループのデータに対し箱ひげ図を並べて作成する。 箱线图
グループ別に色分けされたマーカーを使用した散布図を作成する。 gscatter
グループ別に色分けされたマーカーを使用した散布図行列を作成する。 gplotmatrix
グループ別の要約統計を計算する。 grpstats
グループ平均の間の差を検定する。 anovan
グループ化変数からインデックスベクトルを作成する。 grp2idx

グループ化変数の欠損値

有効なインジケーターが設定されていれば,グループ化変数に欠損値を設定できます。

グループ化変数のデータ型 欠損値インジケーター
数値ベクトル
逻辑ベクトル (欠損値不可)
文字配列 空白行
字符串配列 < >失踪または""
文字ベクトルの细胞配列
直言ベクトル <定义>

参考

関連する例

詳細