数据集

(不推荐)构造数据集的数组

的数据集数据类型是不可取的。使用异构数据,使用MATLAB^®表数据类型。看到MATLAB表文档的更多信息。

语法

=数据集(varspec”,ParamName”,价值) =数据集(“文件”,文件名”,ParamName”,价值) =数据集(“XLSFile”,文件名”,ParamName”,价值) =数据集(“XPTFile”,xptfilename”,ParamName”,价值)

描述

=数据集(varspec”,ParamName”,价值)创建数据集的数组一个使用工作空间变量的输入方法varspec和一个或多个可选的名称/值对(见参数名称/值对)。

输入方法varspec可以是一个或多个下列:

VAR——一个工作空间变量。数据集使用工作空间名称的变量名一个。包括多个变量,指定VAR_1,VAR_2、……VAR_N。变量可以是任何大小的数组,但所有变量都必须有相同的行数。VAR也可以是一个表达式。在这种情况下,数据集自动创建一个默认名称。
{VAR,的名字}-一个工作空间变量,VAR和一个变量名,的名字。数据集使用的名字变量名。包括多个变量和名称,指定{VAR_1,name_1},{VAR_2,name_2},……,{VAR_N,name_N}。
{VAR,name_1,…,name_m},米圆柱状的工作空间变量,VAR。数据集使用的名字name_1,…,name_m变量名。你必须包括每一列的名称VAR。每一列成为一个独立的变量一个。

你可以把这些输入方法包括尽可能多的变量和名称。名称必须是有效的,独特的MATLAB标识符。例如输入组合,查看示例。可选名称/值对输入。

将数值数组、细胞阵列,阵列结构,或表数据数组,您还可以使用(分别):

请注意

数组数据集可能包含内置类型作为变量或数组对象。数组对象必须实现以下:

标准MATLAB括号索引的形式var(我…),在那里我是一个数字或逻辑向量对应变量的行吗
一个大小方法昏暗的论点
一个vertcat方法

=数据集(“文件”,文件名”,ParamName”,价值)创建数据集的数组一个从用于指定的文本文件中的数据文件名。变量一个的类型双如果文件的数据在相应的列,列标题后,完全是数字;否则变量一个细胞阵列的特征向量。数据集将空字段南(对于一个数值型变量)或空的特征向量(character-valued变量)。数据集忽略了无关紧要的文件中的空白。你不能指定一个文件和工作空间变量作为输入。有关更多信息,请参见名称/值对。

=数据集(“XLSFile”,文件名”,ParamName”,价值)创建数据集的数组一个从用于Excel中的数据^®指定的表格文件名。变量一个的类型双如果电子表格的数据在相应的列,列标题后,完全是数字;否则变量一个细胞阵列的特征向量。有关更多信息,请参见名称/值对。

=数据集(“XPTFile”,xptfilename”,ParamName”,价值)创建一个数据集从SAS数组^®XPORT格式文件。变量名从XPORT格式文件保存。数值数据类型XPORT格式文件保存,但所有其他数据类型转换为细胞阵列的特征向量。XPORT格式允许28缺失的数据类型。数据集代表这些文件中的一个大写字母,“。”或“_”。数据集将所有丢失的数据南值一个。有关更多信息,请参见名称/值对。

参数名称/值对

指定一个或多个下列名称/值对,构造一个数据集:

`VarNames`	一个字符串数组或单元数组`{name_1,…, name_m}`命名的`米`变量`一个`与指定的变量名。名称必须是有效的,独特的MATLAB标识符。人名的数目必须相等数量的变量`一个`。你不能使用`VarNames`如果你为个人提供名称变量使用参数`{VAR,名称}`对。指定`VarNames`当使用一个文件作为输入,设置`ReadVarNames`来`假`。
`ObsNames`	一个字符串数组或单元数组`{name_1,…, name_n}`命名的`n`观察`一个`与指定的观察名单。名称不需要有效的MATLAB标识符,但必须是唯一的。人名的数目必须相等数量的观察(行)`一个`。指定`ObsNames`当使用一个文件作为输入,设置`ReadObsNames`来`假`。

名称/值对可用使用文本文件作为输入时:

`分隔符`	一个特征向量或字符串标量表示文件中的字符分隔列。值是 `' \ t '`(选项卡,当没有违约`格式`指定) `' '`(空间,默认时`格式`指定) `”、“`(逗号) `“;”`(分号) `“\|”`(酒吧)
`格式`	矢量格式字符或字符串标量,接受`textscan`。`数据集`读取文件使用`textscan`,并创建变量`一个`根据矢量转换格式说明符的字符或字符串标量。你也可以提供任何名称/值对接受`textscan`。使用`格式`参数是大文件的快得多。如果`ReadObsNames`是`真正的`,然后`格式`应该包括文件的第一列的格式说明符。
`HeaderLines`	数值显示的行数跳过一个文件的开头。默认值:`0`
`TreatAsEmpty`	指定字符治疗为空字符数值列向量。值可以是一个字符数组,字符串数组或单元阵列的特征向量。文件中的参数仅适用于数字列;`数据集`不接受数字文字如`“-99”`。

名称/值对可用时使用文本文件或Excel电子表格作为输入:

ReadVarNames

一个逻辑值指示是否(真正的)(假)从第一行读取变量名称的文件。默认值是真正的。如果ReadVarNames是真正的变量名在文件的列标题或范围(如果使用Excel电子表格)不能是空的。

ReadObsNames

一个逻辑值指示是否(真正的)(假)观察名字的第一列文件读取或范围(如果使用Excel电子表格)。默认值是假。如果ReadObsNames和ReadVarNames都是真正的,数据集保存文件中第一列的标题或范围的名称第一个维度A.Properties.DimNames。

当阅读从一个XPT材料格式文件,ReadObsNames参数名称/值对决定是否尝试使用第一个文件中的变量作为观察的名字。指定作为一个逻辑值(默认假)。如果第一个变量的内容不是有效的观察名单数据集读取变量的变量数据集和不设置观察名称数组。

名称/值对可以使用Excel电子表格作为输入时:

`表`	一个积极的标量值的类型`双`指示表数量,或者引用表的名字。
`范围`	一个特征向量或字符串标量的形式`“C1, C2”`在哪里`C1`和`C2`是细胞的名字相反的角落读一个矩形区域,至于吗`xlsread`。默认情况下,矩形区域延伸到最右边的列包含的数据。如果电子表格包含空的列之间的列的数据,或者电子表格包含数字或其他non-tabular信息,指定一个只包含数据的范围。

例子

从工作区中创建一个数据数组变量,包括观察的名字:

负载谷物麦片=数据集(热量、蛋白质、脂肪、钠、纤维、碳水化合物食品,…糖,ObsNames, cereal.Properties名称)。VarDescription =变量(第四章第十节,2);

创建一个数据集从一个数组,多列工作空间变量,为每一列指定变量名:

负荷= cellstr城市类别(类别);城市=数据集({:}}{评级,类别,……ObsNames, cellstr(名字))

从一个文本或电子表格文件加载数据

病人=数据集(‘文件’,‘hospital.dat’,……“分隔符”、“,”、“ReadObsNames”,真的)patients2 =数据集(‘XLSFile’,‘hospital.xls’,……“ReadObsNames”,真的)

从CSV文件装载患者数据hospital.dat和存储信息数据集数组与观察的名字由第一列数据(病人标识):

病人=数据集(“文件”、“医院。dat’,……“格式”、“% s % s % s % % % f % f % % % f % f % f ',…“分隔符”、“,”、“ReadObsNames”,真正的);

你也可以加载数据没有指定格式。数据集将自动创建数据集变量是双数组或单元阵列的特征向量,根据文件的内容:

病人=数据集(‘文件’,‘hospital.dat’,……“分隔符”、“,”,…“ReadObsNames”,真正的);

{0,1}价值变量烟名义,改变标签“不”和“是的”:
```
病人。烟= nominal(patients.smoke,{'No','Yes'});
```

添加新水平烟吸烟者的占位符更详细的历史:

病人。烟= addlevels(patients.smoke,... {'0-5 Years','5-10 Years','LongTerm'});

如果不吸烟者不吸烟,重新设置“不”水平:
```
病人。烟= setlabels(patients.smoke,'Never','No');
```
将未分化“是的”级别从烟:
```
病人。烟= droplevels(patients.smoke,'Yes');
```
请注意,现在吸烟者有一个未定义的水平。
设置每个吸烟者的一个新的水平,通过观察名称:
```
patients.smoke (ypl - 320 ') = 5 - 10年的;
```

另请参阅

主题

介绍了R2007a

数据集

语法

描述

参数名称/值对

例子

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一个循序渐进的指导与MATLAB