类别:数据集
(不推荐)构造数据集数组
的数据集
不推荐使用数据类型。要处理异构数据,请使用MATLAB®桌子
而不是数据类型。参见MATLAB桌子
有关更多信息,请参阅文档。
A=数据集(
瓦斯派克
,'参数名
',价值
)
A=数据集('文件',文件名
,'参数名
',价值
)
=数据集(“XLSFile”,文件名
,'参数名
',价值
)
=数据集(“XPTFile”,xptfilename
,'参数名
',价值
)
A=数据集(
创建数据集的数组瓦斯派克
,'参数名
',价值
)一个
使用工作区变量输入法瓦斯派克
和一个或多个可选名称/值对(请参阅参数名称/值对)。
输入法瓦斯派克
可以是以下一项或多项:
变量
-工作空间变量。数据集
将工作区名称用作中的变量名称一个
.要包含多个变量,请指定VAR_1
,VAR_2
,...,瓦伦
.变量可以是任意大小的数组,但所有变量必须具有相同的行数。变量
也可以是一个表达式。在这种情况下,,数据集
自动创建默认名称。
{变量
,的名字
}—一个工作区变量,变量
和一个变量名,的名字
.数据集
使用的名字
作为变量名。要包含多个变量和名称,请指定{VAR_1
,name_1
}, {VAR_2
,name_2
},..., {瓦伦
,name_N
}.
{变量
,name_1
,...
,name_m
},米-列式工作空间变量,变量
.数据集
使用名称name_1
,...
,name_m
作为变量名。必须为中的每一列包含一个名称变量
。每列在中成为一个单独的变量一个
.
您可以根据需要组合这些输入方法以包含尽可能多的变量和名称。名称必须是有效的、唯一的MATLAB标识符。有关输入组合的示例,请参见示例。有关可选名称/值对,请参阅输入。
要将数字数组、单元格数组、结构数组或表转换为数据集数组,还可以使用(分别):
请注意
数据集数组可以包含内置类型或数组对象作为变量。数组对象必须实现以下各项:
标准MATLAB括号索引的形式var(我…)
哪里我
是对应于变量行的数字或逻辑向量
一个大小
方法昏暗的
论点
一个维特卡特
方法
A=数据集('文件',
创建数据集的数组文件名
,'参数名
',价值
)一个
从指定的文本文件中的面向列的数据文件名
.变量一个
的类型双重的
如果文件相应列中的数据(列标题后)完全是数字;否则,变量一个
是字符向量的单元格数组。数据集
将空字段转换为南
(对于数字变量)或空字符向量(对于字符值变量)。数据集
忽略文件中不重要的空白。不能同时指定文件和工作空间变量作为输入。有关详细信息,请参见名称/值对。
=数据集(“XLSFile”,
创建数据集的数组文件名
,'参数名
',价值
)一个
从Excel中的面向列的数据®指定的电子表格文件名
.变量一个
的类型双重的
如果在电子表格的相应列中,列标题后面的数据完全是数字;否则一个
是字符向量的单元格数组。有关更多信息,请参阅名称/值对。
=数据集(“XPTFile”,
从SAS创建数据集阵列®XPORT格式文件。保留XPORT格式文件中的变量名。XPORT格式文件中的数字数据类型被保留,但所有其他数据类型都被转换为字符向量的单元格数组。XPORT格式允许丢失28种数据类型。xptfilename
,'参数名
',价值
)数据集
用大写字母表示文件中的这些内容,“。”
或“_”
.数据集
将所有丢失的数据转换为南
值一个
。有关详细信息,请参阅名称/值对。
构造数据集时,请指定以下一个或多个名称/值对:
|
字符串数组或单元格数组 |
|
字符串数组或单元格数组 |
当使用文本文件作为输入时可用的名称/值对:
|
字符向量或字符串标量,指示文件中分隔列的字符。值是
|
|
所接受的格式字符向量或字符串标量 |
|
指示文件开头要跳过的行数的数值。 默认值: |
|
指定要视为数字列中的空字符向量的字符。值可以是字符数组、字符串数组或字符向量的单元格数组。该参数仅适用于文件中的数字列; |
使用文本文件或Excel电子表格作为输入时可用的名称/值对:
|
一个逻辑值,指示是否( |
|
一个逻辑值,指示是否( 从一个 |
使用Excel电子表格作为输入时可用的名称/值对:
|
类型的正标量值 |
|
这种形式的字符向量或字符串标量 |
从工作区变量创建一个数据集数组,包括观察名称:
谷物=数据集(卡路里,蛋白质,脂肪,钠,纤维,碳水化合物,…properties . vardescription =变量(4:10,2);
从单个多列工作空间变量创建数据集数组,为每列指定变量名称:
加载城市类别=单元STR(类别);城市=数据集({ratings,categories{:}},'ObsNames',单元STR(names))
从文本或电子表格文件加载数据
病人=数据集(‘文件’,‘hospital.dat’,……'Delimiter',',' ReadObsNames',true) patients2 = dataset('XLSFile','hospital.xls',…“ReadObsNames”,真的)
从CSV文件加载患者数据hospital.dat
并将信息存储在数据集
数组,观察名称由数据的第一列给出(患者识别):
Patients = dataset('file','hospital.dat',…“格式”、“% s % s % s % % % f % f % % % f % f % f ',…“分隔符”、“,”、“ReadObsNames”,真正的);
您还可以在不指定格式的情况下加载数据。数据集
将自动创建数据集
变量是双重的
字符向量的数组或单元格数组,具体取决于文件的内容:
患者=数据集('file'、'hospital.dat'、…'delimiter'、'、'、…'ReadObsNames',true);
使{0,1}成为有值变量烟
标称,并将标签更改为“不”
和“是的”
:
病人。烟= nominal(patients.smoke,{'No','Yes'});
将新级别添加到烟
作为更详细的吸烟者历史的占位符:
患者吸烟=增加水平(患者吸烟,{'0-5年','5-10年','长期');
假设不吸烟者从未吸烟,重新贴上标签“不”
级别:
patients.smoke=setlabels(patients.smoke,'Never','No');
将未分化“是的”
级别从烟
:
patients.smoke=雾滴水平(patients.smoke,'Yes');警告:OLDLEVELS包含存在于中的分类级别,导致某些数组元素具有未定义的级别。
注意,吸烟者现在有一个未定义的级别。
根据观察名称,将每个吸烟者设置为一个新的水平:
吸烟('YPL-320')='5-10年';