定义表的导入选项
方法通常可以导入表readtable
函数。然而,有时导入表格数据需要对导入过程进行额外的控制。例如,您可能希望选择导入或处理缺少或导致错误的数据行的变量。为了控制导入过程,可以创建一个导入选项对象。对象具有可以根据导入需要调整的属性。
创建导入选项
要为示例数据集创建导入选项对象,请执行以下操作:airlinesmall.csv
,使用detectImportOptions
函数。的detectImportOptions
函数创建DelimitedTextImportOptions
对象用于此文本文件。有关导入选项对象属性的完整列表,请参见detectImportOptions
参考页面。
opts = detectImportOptions(“airlinesmall.csv”);
自定义表级导入选项
导入选项对象具有可以调整以控制导入过程的属性。有些属性应用于整个表,而其他属性应用于特定变量。影响整个表的属性包括管理导致错误或丢失数据的规则。属性删除导致导入错误的数据行ImportErrorRule
来“omitrow”
.属性替换缺失的值MissingRule
来“填满”
.的FillValue
属性值决定用什么值替换缺失的值。例如,您可以用南
.
选择。ImportErrorRule =“omitrow”;选择。MissingRule =“填满”;
自定义可变级别导入选项
获取和设置特定变量的选项getvaropts
,setvartype
,setvaropts
功能。例如,查看指定变量的当前选项FlightNum
,起源
,桌子
,ArrDelay
,使用getvaropts
函数。
getvaropts(选择,{“FlightNum”,“起源”,“桌子”,“ArrDelay”});
属性更改变量的数据类型setvartype
功能:
因为变量中的值
FlightNum
是航班的标识符而不是数值,将其数据类型更改为字符
.因为变量
起源
而且桌子
指定一个有限的重复文本值集,将其数据类型更改为分类
.
选项= setvartype(选项,{“FlightNum”,“起源”,“桌子”,“ArrDelay”},...{“字符”,“分类”,“分类”,“单一”});
属性更改其他属性setvaropts
功能:
为
FlightNum
属性,删除文本中的前导空白WhiteSpaceRule
财产trimleading
.为
ArrDelay
变量,替换包含0
或NA
中指定的值FillValue
属性,以设置TreatAsMissing
财产。
Opts = setvaropts(选项,“FlightNum”,“WhitespaceRule”,“trimleading”);Opts = setvaropts(选项,“ArrDelay”,“TreatAsMissing”, {' 0 ',“NA”});
导入表
指定要获取的变量,使用readtable
,并显示第一个8
表的行。
选择。SelectedVariableNames = {“FlightNum”,“起源”,“桌子”,“ArrDelay”};T =可读的(“airlinesmall.csv”、选择);T (1:8,:)
ans =8×4表FlightNum Origin Dest ArrDelay _________ ______ ____ ________ {'1503'} LAX SJC 8 {'1550'} SJC BUR 8 {'1589'} SAN SMF 21 {'1655'} BUR SJC 13 {'1702'} SMF LAX 4 {'1729'} LAX SJC 59 {'1763'} SAN SFO 3 {'1800'} SEA LAX 11
另请参阅
detectImportOptions
|getvaropts
|setvaropts
|setvartype
|readtable
|SpreadsheetImportOptions
|DelimitedTextImportOptions
|readmatrix
|readcell
|readvars