使用名义的优点和有序数组
请注意
的名义上的
和序数
数组数据类型是不推荐的。代表有序和无序的离散、非数字数据使用分类数组数据类型。
操作的级别
在处理分类变量及其水平时,你会遇到一些典型的挑战。这个表总结了函数可以使用与名义或序数数组操作类别的水平。额外的功能、类型方法的名义
或方法顺序
在命令行或看到名义上的
和序数
参考页面。
任务 | 函数 |
---|---|
添加新类别的水平 | addlevels |
类别水平下降 | droplevels |
结合分类水平 | mergelevels |
重新排序类别水平 | reorderlevels |
数一数每个类别的观察 | levelcounts |
改变类别的标签或名称的水平 | setlabels |
创建一个交互因素 | 次 |
观察发现并不在一个定义的类别 | isundefined |
分析使用名义和有序数组
您可以使用名义和顺序数组在各种统计分析。例如,您可能想计算描述性统计数据按类别分组,进行统计检验类别之间的差异意味着,或使用分类预测因子进行回归分析。
统计和机器学习工具箱™函数接受一个分组变量作为输入参数接受名义和有序数组。这包括描述性的功能,如:
您还可以使用名义和顺序数组作为输入参数基于模型分析功能和方法,如:
当你使用名义或顺序数组作为预测这些函数,拟合函数自动识别分类预测,构造适当的虚拟变量指标进行分析。或者,您可以构建自己的仿真指示器变量使用dummyvar
。
减少内存需求
分类变量的水平通常定义为文本,它可以是昂贵的储存和操作单元阵列的特征向量字符
数组中。名义和顺序数组分别存储类别界定和分类标签,大大减少所需的内存来存储变量。
例如,一些示例数据加载:
负载(“fisheriris”)
物种
是一个单元阵列特征向量的需要19300字节的内存。
转换物种
一个名义上的数组:
物种=名义(物种);
有95%的减少内存需要存储的变量。