ノミナル配列と順序配列を使用する利点

メモ

nominal配列データ型およびordinal配列データ型は推奨されません。順序付きおよび順序付けのない離散非数値データを表すには、代わりにcategorical 配列データ型を使用します。

カテゴリレベルの操作

カテゴリカル変数とそのレベルを操作する場合に必要となる一般的な操作があります。次の表は、カテゴリレベルを操作するためにノミナル配列または順序配列で使用できる関数の一覧です。この他の関数については、コマンドラインで「methods nominal」または「methods ordinal」と入力するか、nominalおよびordinalのリファレンスページを参照してください。

タスク	関数
新しいカテゴリレベルの追加	`addlevels`
カテゴリレベルの削除	`droplevels`
カテゴリレベルの結合	`mergelevels`
カテゴリレベルでの並べ替え	`reorderlevels`
各カテゴリの観測数のカウント	`levelcounts`
カテゴリレベルのラベルまたは名前の変更	`setlabels`
交互作用因子の作成	`times`
定義済みカテゴリに該当しない観測値の探索	`isundefined`

ノミナル配列と順序配列を使用した分析

ノミナル配列と順序配列は、さまざまな統計分析で使用できます。たとえば、カテゴリレベル別にデータの記述統計を計算したり、カテゴリ平均の間の差分に関する統計的検定を実行したり、カテゴリカル予測子による回帰解析を実行することができます。

グループ化変数を入力引数として受け入れる Statistics and Machine Learning Toolbox™ 関数は、ノミナル配列と順序配列を受け入れます。この中には、次の説明的な関数などが含まれます。

また、ノミナル配列と順序配列は、モデルに基づいて次のような分析関数およびメソッドに対する入力引数として使用することもできます。

ノミナル配列または順序配列をこれらの関数で予測子として使用すると、近似関数が自動的にカテゴリカル予測子を認識し、分析用の適切なダミー指標変数を作成します。また、dummyvarを使用して独自のダミー指標変数を作成することもできます。

メモリ要件の軽減

カテゴリカル変数のレベルはテキストとして定義されることが多く、その場合文字ベクトルの cell 配列やchar配列で格納や操作を行うには多大なコストがかかる可能性があります。ノミナル配列と順序配列ではカテゴリのメンバーシップとラベルが別々に格納されるので、変数の格納に必要なメモリが大幅に削減されます。

例として、標本データを読み込んでみましょう。