ノミナル配列と順序配列を使用する利点
メモ
nominal
配列データ型およびordinal
配列データ型は推奨されません。順序付きおよび順序付けのない離散非数値データを表すには、代わりにcategorical 配列データ型を使用します。
カテゴリ レベルの操作
カテゴリカル変数とそのレベルを操作する場合に必要となる一般的な操作があります。次の表は、カテゴリ レベルを操作するためにノミナル配列または順序配列で使用できる関数の一覧です。この他の関数については、コマンド ラインで「methods nominal
」または「methods ordinal
」と入力するか、nominal
およびordinal
のリファレンス ページを参照してください。
タスク | 関数 |
---|---|
新しいカテゴリ レベルの追加 | addlevels |
カテゴリ レベルの削除 | droplevels |
カテゴリ レベルの結合 | mergelevels |
カテゴリ レベルでの並べ替え | reorderlevels |
各カテゴリの観測数のカウント | levelcounts |
カテゴリ レベルのラベルまたは名前の変更 | setlabels |
交互作用因子の作成 | times |
定義済みカテゴリに該当しない観測値の探索 | isundefined |
ノミナル配列と順序配列を使用した分析
ノミナル配列と順序配列は、さまざまな統計分析で使用できます。たとえば、カテゴリ レベル別にデータの記述統計を計算したり、カテゴリ平均の間の差分に関する統計的検定を実行したり、カテゴリカル予測子による回帰解析を実行することができます。
グループ化変数を入力引数として受け入れる Statistics and Machine Learning Toolbox™ 関数は、ノミナル配列と順序配列を受け入れます。この中には、次の説明的な関数などが含まれます。
また、ノミナル配列と順序配列は、モデルに基づいて次のような分析関数およびメソッドに対する入力引数として使用することもできます。
ノミナル配列または順序配列をこれらの関数で予測子として使用すると、近似関数が自動的にカテゴリカル予測子を認識し、分析用の適切なダミー指標変数を作成します。また、dummyvar
を使用して独自のダミー指標変数を作成することもできます。
メモリ要件の軽減
カテゴリカル変数のレベルはテキストとして定義されることが多く、その場合文字ベクトルの cell 配列やchar
配列で格納や操作を行うには多大なコストがかかる可能性があります。ノミナル配列と順序配列ではカテゴリのメンバーシップとラベルが別々に格納されるので、変数の格納に必要なメモリが大幅に削減されます。
例として、標本データを読み込んでみましょう。
load('fisheriris')
species
は文字ベクトルの cell 配列で、メモリが 19,300 バイト必要です。
species
をノミナル配列に変換します。
species = nominal(species);
変数の格納に必要なメモリは 95% 減少しています。