主要内容

定义表的导入选项

属性可以导入表readtable函数。但是,有时导入表格数据需要对导入过程进行额外的控制。例如,您可能希望选择导入或处理带有丢失或导致错误数据的行的变量。要控制导入过程,您可以创建一个导入选项对象。对象具有可以根据导入需要调整的属性。

创建导入选项

要为样本数据集创建导入选项对象,Airlinesmall.csv.,可以使用detectImportOptions函数。的detectImportOptions函数创建一个DelimitedTextImportOptions对象用于此文本文件。有关导入选项对象的完整属性列表,请参见detectImportOptions参考页面。

opts = detectimportoptions(“airlinesmall.csv”);

自定义表级导入选项

导入选项对象具有您可以调整以控制导入过程的属性。一些属性适用于整个表,而其他属性适用于特定的变量。影响整个表的属性包括用于管理导致错误或丢失数据的规则。例如,可以通过设置ImportErrorRule“omitrow”.属性来替换缺失的值MissingRule“填满”.的fillvalue.属性值确定用什么值替换缺失的值。例如,您可以用

选择。ImportErrorRule =“omitrow”;选择。MissingRule =“填满”

自定义变量级别导入选项

属性获取和设置特定变量的选项getvaroptssetvartype,setvaropts职能。例如,查看命名的变量的当前选项FlightNum起源桌子,ArrDelay,使用getvaropts函数。

getvaropts(选择,{“FlightNum”“起源”'ide'“ArrDelay”});

属性更改变量的数据类型setvartype功能:

  • 因为变量中的值FlightNum航班的标识符而不是数值,是否将其数据类型更改为字符

  • 自变量以来起源桌子指定一组有限的重复文本值,将其数据类型更改为分类

选择= setvartype(选择,{“FlightNum”“起源”'ide'“ArrDelay”},...'char'“分类”“分类”“单一”});

使用该属性更改其他属性setvaropts功能:

  • FlightNum变量,通过设置删除文本中的任何领先的白色空间wh财产trimleading

  • ArrDelay变量,替换包含的字段0或者NA.中指定的值fillvalue.属性。TreatAsMissing财产。

选择= setvaropts(选择,“FlightNum”'whitespacerule'“trimleading”);选择= setvaropts(选择,“ArrDelay”“TreatAsMissing”,{' 0 '“NA”});

导入表

指定要获取的变量,并使用它们导入readtable,显示第一个8表的行数。

选择。SelectedVariableNames = {“FlightNum”“起源”'ide'“ArrDelay”};T = readtable (“airlinesmall.csv”、选择);T (1:8,:)
ans =8×4表FlightNum Origin Dest ArrDelay _________ ______ ____ ________ {'1503'} LAX SJC 8 {'1550'} SJC BUR 8 {'1589'} SAN SMF 21 {'1655'} BUR SJC 13 {'1702'} SMF LAX 4 {'1729'} LAX SJC 59 {'1763'} SAN SFO 3 {'1800'} SEA LAX 11 . FlightNum Origin Dest ArrDelay FlightNum Origin Dest ArrDelay _________ ______ ____ ________ {'1503'} LAX SJC 8 {'1589'} SAN SMF 21 {'1655'} BUR SJC 13 {'1702'

另请参阅

|||||||||

相关话题