Statistics和Machine Learning Toolbox™提供了两种额外的数据类型。方法处理有序和无序的离散、非数字数据名义上的
和序数
数据类型。属性将多个变量(包括具有不同数据类型的变量)存储到单个对象中数据集
阵列数据类型。但是,这些数据类型是统计和机器学习工具箱的唯一。有关更大的横向产品兼容性,请使用分类
或者桌子
数据类型,分别,可在MATLAB®.有关更多信息,请参阅创建分类数组,创建表并将数据分配给它们,或者看看表和分类数组.
数据集 |
(不推荐)统计数据阵列 |
标称数组和序数数组存储的数据具有一组有限的离散级别,这些级别可能具有自然顺序,也可能没有。
轻松操纵类别级别,进行统计分析,降低内存要求。
分组变量是用于对观察进行分组或分类的效用变量。
虚拟变量让您适应分类数据以用于分类和回归分析。
了解支持标称和序数阵列的MATLAB功能。金宝app
使用标称和序号阵列使用名义上的
和序数
,分别。
使用。将数值数据分类为类别序号数组序数
.
使用setlabels
.
从标称或序号数组中添加和删除级别。
使用标称或序数阵列的合并类别mergelevels
.
使用标称或序号阵列中的类别级别重新排序reorderlevels
.
确定顺序数组的排序顺序。
由分类变量的级别分组的绘图数据。
根据分类变量的级别计算汇总统计信息。
测试类别(组)意味着的显着差异t-检验、双向方差分析(ANOVA)、协方差分析(ancova)。
索引和搜索数据由其类别或组。
使用分类数组和执行分类协变量回归fitlm
.
数据集数组存储异构类型的数据。
从MATLAB工作空间中的数值数组或异构变量创建数据集数组。
从选项卡分隔或分隔文本或Excel文件的内容创建数据集数组。
在数据集数组中添加和删除观察值。
在数据集数组中添加和删除变量。
使用数据集数组变量及其数据。
从数据集阵列中选择观察或观察子集。
使用命令行排序数据集数组中的观察值(行)。
使用以下方法合并数据集数组加入
.
使用堆栈
和unstack
.
查找,清洁和删除数据集数组中缺少数据的观察。
对DataSet阵列执行计算,包括使用分组变量的平均和总结。
从MATLAB工作区导出数据集数组到文本或电子表格文件。
MATLAB变量编辑器为查看、修改和绘制数据集数组提供了方便的界面。
了解索引到数据集数组中的许多方法。
这个示例展示了如何使用数据集数组执行线性和逐步回归分析。