请注意
的数据集
不推荐使用数据类型。要处理异构数据,请使用MATLAB®表格
数据类型。看到MATLAB表格
文档以获取更多信息。
统计和机器学习工具箱™数据集阵列用于存储具有异构数据类型的变量。例如,可以在一个数据集数组变量中组合数字数据、逻辑数据、字符向量的单元格数组和类别数组。
在数据集数组中,每个变量(列)必须是一个同构数据类型,但不同的变量可以是异构数据类型。数据集阵列通常被解释为一组由许多观测单位测量的变量。也就是说,数据集数组中的每一行对应一个观察值,每一列对应一个变量。在这种意义上,数据集数组像典型的电子表格一样组织数据。
数据集数组是唯一的数据类型,具有相应的有效操作集。即使数据集数组只包含数字变量,您也不能像操作数字变量那样对数据集数组进行操作。属性的方法是数据集数组的有效操作数据集
类。
您可以通过组合MATLAB工作空间中存在的变量来创建数据集数组,或者直接从文件(如文本文件或电子表格)导入数据。该表总结了用于创建数据集数组的函数。
数据源 | 转换为数据集数组 |
---|---|
文件中的数据 | 数据集 |
工作区变量的异构集合 | 数据集 |
数字数组 | mat2dataset |
单元阵列 | cell2dataset |
结构数组 | struct2dataset |
表格 | table2dataset |
使用。可以将数据集数组导出到文本或电子表格文件出口
.若要将数据集数组转换为单元格数组或结构数组,请使用dataset2cell
或者dataset2struct
.若要将数据集数组转换为表,请使用dataset2table
.
除了将数据存储在数据集数组中,您还可以存储元数据,例如:
变量名和观测名
数据描述
测量单位
变量描述
此信息存储为数据集数组属性。用于命名的数据集数组ds
,可以通过输入查看数据集阵列元数据ds。属性
在命令行。您可以访问一个特定的属性,例如变量名- propertyVarNames
习语ds.Properties.VarNames
.您可以使用此语法检索和修改属性值。
数据集数组的显示中包含变量和观测名称。变量名显示在最上面一行,观察名(如果有的话)显示在第一列。请注意,变量和观察名称不会影响数据集数组的大小。
数据集
|出口
|dataset2cell
|dataset2struct
|dataset2table
|mat2dataset
|cell2dataset
|struct2dataset
|table2dataset