主要内容

数据集的数组

请注意

数据集不推荐选择数据类型。要处理异构数据,请使用MATLAB®表格而是数据类型。看到MATLAB表格文档获取更多信息。

什么是数据集数组?

统计和机器学习工具箱™数据集的数组用于存储具有异构数据类型的变量。例如,可以在一个数据集数组变量中组合数值数据、逻辑数据、字符向量的单元格数组和分类数组。

在数据集数组中,每个变量(列)必须是一种同构数据类型,但不同的变量可以是异类数据类型。数据集数组通常被解释为在许多观察单位上测量的一组变量。也就是说,数据集数组中的每一行对应一个观测值,每一列对应一个变量。在这个意义上,数据集数组像典型的电子表格一样组织数据。

数据集数组是一种唯一的数据类型,具有一组相应的有效操作。即使数据集数组只包含数值变量,也不能像数值变量那样对数据集数组进行操作。方法的方法是数据集数组的有效操作数据集类。

数据集阵列转换

您可以通过组合MATLAB工作空间中存在的变量,或直接从文件(如文本文件或电子表格)导入数据来创建数据集数组。下表总结了可用于创建数据集数组的函数。

数据源 转换为数据集数组
来自文件的数据 数据集
工作空间变量的异构集合 数据集
数字数组 mat2dataset
单元阵列 cell2dataset
结构数组 struct2dataset
表格 table2dataset

可以使用将数据集数组导出到文本或电子表格文件出口.若要将数据集数组转换为单元格数组或结构数组,请使用dataset2celldataset2struct.若要将数据集数组转换为表,请使用dataset2table

数据集数组属性

除了在数据集数组中存储数据外,您还可以存储元数据,例如:

  • 变量和观察名称

  • 数据描述

  • 计量单位

  • 变量描述

此信息存储为数据集数组属性。的数据集数组ds,您可以通过输入查看数据集数组元数据ds。属性在命令行。您可以访问特定的属性,例如变量names-propertyVarNames习语ds.Properties.VarNames.您可以使用此语法检索和修改属性值。

变量和观察名称包含在数据集数组的显示中。变量名显示在第一行,观察名称(如果存在)显示在第一列。注意,变量名和观测值名不会影响数据集数组的大小。

另请参阅

||||||||

相关的话题