主要内容

数据类型

分组变量、分类数据和数据集数组

Statistics和Machine Learning Toolbox™提供了两种额外的数据类型。方法处理有序和无序的离散、非数字数据名义上的序数数据类型。属性将多个变量(包括具有不同数据类型的变量)存储到单个对象中数据集阵列数据类型。但是,这些数据类型是统计和机器学习工具箱的唯一。有关更大的横向产品兼容性,请使用分类或者桌子数据类型,分别,可在MATLAB®.有关更多信息,请参阅创建分类数组创建表并将数据分配给它们,或者看看表和分类数组

功能

全部展开

名义上的 (不推荐)标称数据的阵列
序数 (不推荐)用于排序数据的数组
dummyvar 创建虚拟变量
onehotencode 将数据标签编码为热点向量
onehotdecode 解码概率向量到类标签
gplotmatrix 散点图分组矩阵
grp2idx 从分组变量创建索引向量
g箭偶 分散绘图由组
mat2dataset. (不推荐)将矩阵转换为数据集数组
cell2dataset (不推荐)将单元格数组转换为数据集数组
struct2dataset. (不推荐)将结构数组转换为数据集数组
table2dataset (不推荐)将表转换为数据集数组
dataset2cell (不推荐)将数据集数组转换为单元格数组
dataset2struct (不推荐)将数据集数组转换为结构
dataset2table 将数据集数组转换为表
出口 (不推荐)将数据集数组写入文件
ismissing (不推荐)查找缺少值的数据集数组元素
加入 (不推荐)合并数据集阵列观测

数据集 (不推荐)统计数据阵列

主题

分类数据

标称和序数数组

标称数组和序数数组存储的数据具有一组有限的离散级别,这些级别可能具有自然顺序,也可能没有。

使用标称和序数数组的优点

轻松操纵类别级别,进行统计分析,降低内存要求。

分组变量

分组变量是用于对观察进行分组或分类的效用变量。

虚拟变量

虚拟变量让您适应分类数据以用于分类和回归分析。

支持标称和序数数组的其他MATLAB函数金宝app

了解支持标称和序数阵列的MATLAB功能。金宝app

创建标称和序数数组

使用标称和序号阵列使用名义上的序数,分别。

分类数字数据

使用。将数值数据分类为类别序号数组序数

更改类别标签

使用setlabels

添加和删除类别级别

从标称或序号数组中添加和删除级别。

合并的级别

使用标称或序数阵列的合并类别mergelevels

重新排序类别级别

使用标称或序号阵列中的类别级别重新排序reorderlevels

排序顺序数组

确定顺序数组的排序顺序。

按类别分组的数据

由分类变量的级别分组的绘图数据。

汇总统计按类别分组

根据分类变量的级别计算汇总统计信息。

测试类别平均值之间的差异

测试类别(组)意味着的显着差异t-检验、双向方差分析(ANOVA)、协方差分析(ancova)。

使用标称和序数数组的索引和搜索

索引和搜索数据由其类别或组。

线性回归与范畴协变量

使用分类数组和执行分类协变量回归fitlm

数据集阵列

数据集阵列

数据集数组存储异构类型的数据。

从工作区变量创建数据集数组

从MATLAB工作空间中的数值数组或异构变量创建数据集数组。

从文件创建数据集数组

从选项卡分隔或分隔文本或Excel文件的内容创建数据集数组。

添加和删​​除观察

在数据集数组中添加和删除观察值。

添加和删除变量

在数据集数组中添加和删除变量。

访问数据集数组变量中的访问数据

使用数据集数组变量及其数据。

选择观察的子集

从数据集阵列中选择观察或观察子集。

对数据集数组中的观察排序

使用命令行排序数据集数组中的观察值(行)。

合并数据集的数组

使用以下方法合并数据集数组加入

堆栈或unstack dataset阵列

使用堆栈unstack

清理混乱和丢失的数据

查找,清洁和删除数据集数组中缺少数据的观察。

数据集数组的计算

对DataSet阵列执行计算,包括使用分组变量的平均和总结。

出口数据数组

从MATLAB工作区导出数据集数组到文本或电子表格文件。

变量编辑器中的数据集数组

MATLAB变量编辑器为查看、修改和绘制数据集数组提供了方便的界面。

索引和搜索数据集数组

了解索引到数据集数组中的许多方法。

使用数据集数组的回归

这个示例展示了如何使用数据集数组执行线性和逐步回归分析。