主要内容

数据集的数组

请注意

数据集不推荐使用数据类型。要处理异构数据,请使用MATLAB®表格数据类型。看到MATLAB表格文档以获取更多信息。

什么是数据集数组?

统计和机器学习工具箱™数据集阵列用于存储具有异构数据类型的变量。例如,可以在一个数据集数组变量中组合数字数据、逻辑数据、字符向量的单元格数组和类别数组。

在数据集数组中,每个变量(列)必须是一个同构数据类型,但不同的变量可以是异构数据类型。数据集阵列通常被解释为一组由许多观测单位测量的变量。也就是说,数据集数组中的每一行对应一个观察值,每一列对应一个变量。在这种意义上,数据集数组像典型的电子表格一样组织数据。

数据集数组是唯一的数据类型,具有相应的有效操作集。即使数据集数组只包含数字变量,您也不能像操作数字变量那样对数据集数组进行操作。属性的方法是数据集数组的有效操作数据集类。

数据集的数组转换

您可以通过组合MATLAB工作空间中存在的变量来创建数据集数组,或者直接从文件(如文本文件或电子表格)导入数据。该表总结了用于创建数据集数组的函数。

数据源 转换为数据集数组
文件中的数据 数据集
工作区变量的异构集合 数据集
数字数组 mat2dataset
单元阵列 cell2dataset
结构数组 struct2dataset
表格 table2dataset

使用。可以将数据集数组导出到文本或电子表格文件出口.若要将数据集数组转换为单元格数组或结构数组,请使用dataset2cell或者dataset2struct.若要将数据集数组转换为表,请使用dataset2table

数据集的数组属性

除了将数据存储在数据集数组中,您还可以存储元数据,例如:

  • 变量名和观测名

  • 数据描述

  • 测量单位

  • 变量描述

此信息存储为数据集数组属性。用于命名的数据集数组ds,可以通过输入查看数据集阵列元数据ds。属性在命令行。您可以访问一个特定的属性,例如变量名- propertyVarNames习语ds.Properties.VarNames.您可以使用此语法检索和修改属性值。

数据集数组的显示中包含变量和观测名称。变量名显示在最上面一行,观察名(如果有的话)显示在第一列。请注意,变量和观察名称不会影响数据集数组的大小。

另请参阅

||||||||

相关话题