tabularTextDatastore
表格文本文件的数据存储
描述
使用一个TabularTextDatastore
对象来管理包含面向列数据或表格数据的大型文本文件集合,其中集合不一定适合内存。表格数据是按矩形方式排列的数据,每一行都有相同数量的条目。您可以创建TabularTextDatastore
对象使用tabularTextDatastore
函数,指定其属性,然后使用对象函数导入和处理数据。
创建
描述
输入参数
位置
- - - - - -数据存储中包含的文件或文件夹
文件集
对象|文件路径|DsFileSet
对象
包含在数据存储中的文件或文件夹,指定为文件集
对象作为文件路径,或作为DsFileSet
对象。
文件集
object -可以指定位置
作为一个文件集
对象。指定位置为文件集
对象相比于指定路径或DsFileSet
对象。有关更多信息,请参见matlab.io.datastore.FileSet
.文件路径—您可以将单个文件路径指定为字符向量或字符串标量。您可以将多个文件路径指定为字符向量的单元格数组或字符串数组。
DsFileSet
object -可以指定DsFileSet
对象。有关更多信息,请参见matlab.io.datastore.DsFileSet
.
文件或文件夹可以是本地的或远程的:
本地文件或文件夹—指定文件或文件夹的本地路径。如果文件不在当前文件夹中,则指定完整路径或相对路径。指定文件夹的子文件夹中的文件不会自动包含在数据存储中。当指定本地路径时,可以使用通配符*。此字符指定数据存储包括所有匹配文件或匹配文件夹中的所有文件。
远程文件或文件夹——指定远程文件或文件夹的完整路径作为格式的统一资源定位符(URL)
hdfs: / / /
.有关更多信息,请参见使用远程数据.path_to_file
指定文件夹时,数据存储只包括支持的文件格式的文件,而忽略任何其他格式的文件。金宝app若要指定要包含在数据存储中的自定义文件扩展名列表,请参见FileExtensions
财产。
的tabularTextDatastore
函数支持具有这些扩金宝app展名的文件. txt
,. csv
,.dat
,.dlm
,.asc
,。text
以及没有扩展名的文件。
例子:“file1.csv”
例子:“. . / dir /数据/ file1”
例子:[" C: \ dir \ data \ file1.csv”,“C: \ dir \ data \ file2.dat”)
例子:“C: \ dir \ data \ *。
指定可选参数对为Name1 = Value1,…,以=家
,在那里的名字
参数名称和价值
对应的值。名称-值参数必须出现在其他参数之后,但对的顺序无关紧要。
在R2021a之前,使用逗号分隔每个名称和值,并将其括起来的名字
在报价。
例子:ttds = tabularTextDatastore("C:\dir\textdata","FileExtensions",[".csv",".txt"])
FileExtensions
- - - - - -文本文件扩展名
特征向量|字符向量的单元格数组|字符串标量|字符串数组
文本文件扩展名,指定为逗号分隔的对,由“FileExtensions”
字符向量,字符向量的单元格数组,字符串标量,或者字符串数组。指定的扩展不需要受支持的格式。金宝app如果要包括不受支持的扩展,请指定所有扩展。金宝app使用空引号""
表示没有扩展名的文件。
例子:“FileExtensions”、“. txt”
例子:“FileExtensions”(“。text”、“. csv”)
数据类型:字符
|细胞
|字符串
IncludeSubfolders
- - - - - -子文件夹包含标志
真正的
或假
|0或1
子文件夹包含标志,指定为名称-值参数,由“IncludeSubfolders”
而且真正的
,假
、0或1。指定真正的
在每个文件夹或中包含所有文件和子文件夹假
只包括每个文件夹中的文件。
当你不指定时“IncludeSubfolders”
,则默认值为假
.
例子:“IncludeSubfolders”,真的
数据类型:逻辑
|双
OutputType
- - - - - -输出数据类型
“汽车”
(默认)|“表”
|“时间表”
AlternateFileSystemRoots
- - - - - -可选文件系统根路径
字符串向量|单元阵列
可选文件系统根路径,指定为由“AlternateFileSystemRoots”
一个字符串向量或者单元格数组。使用“AlternateFileSystemRoots”
在本地机器上创建数据存储,但需要在另一台机器(可能是不同的操作系统)上访问和处理数据。此外,在使用并行计算工具箱™和MATLAB®并行服务器™,并且数据存储在您的本地机器上,不同平台云或集群机器上可用的数据副本,您必须使用“AlternateFileSystemRoots”
关联根路径。
若要关联一组等价的根路径,请指定
“AlternateFileSystemRoots”
作为一个字符串向量。例如,[" Z: \数据集”、“/ mynetwork /数据集”)
若要关联多个与数据存储等效的根路径集,请指定
“AlternateFileSystemRoots”
作为包含多行的单元格数组,其中每行表示一组等效根路径。将单元格数组中的每一行指定为字符串向量或字符向量的单元格数组。例如:指定
“AlternateFileSystemRoots”
作为字符串向量的单元格数组。{[Z: \“数据集”、“/ mynetwork /数据集”);…[" Y: \数据集”、“/ mynetwork2 /数据集”、“年代:\数据集”)}
另外,指定
“AlternateFileSystemRoots”
作为字符向量的单元格数组的单元格数组。{{“Z: \数据集”、“mynetwork /数据集”},…{“Y: \数据集”,“mynetwork2 /数据集”,年代:\数据集的}}
的价值“AlternateFileSystemRoots”
必须满足这些条件:
包含一行或多行,其中每行指定一组等效的根路径。
每行指定多个根路径,每个根路径至少包含两个字符。
根路径是唯一的,并且不是彼此的子文件夹。
包含至少一个指向文件位置的根路径条目。
有关更多信息,请参见为不同机器或集群上的处理设置数据存储.
例子:[" Z: \数据集”、“/ mynetwork /数据集”)
数据类型:字符串
|细胞
TextType
- - - - - -文本变量的输出数据类型
“字符”
(默认)|“字符串”
输出数据类型的文本变量,指定为由逗号分隔的对组成“TextType”
,要么“字符”
或“字符串”
.如果输出表来自读
,readall
,或预览
函数包含文本变量“TextType”
指定这些变量的数据类型TabularTextDatastore
.如果“TextType”
是“字符”
,则输出为字符向量的单元格数组。如果“TextType”
是“字符串”
,则输出有type字符串
.
数据类型:字符
|字符串
DatetimeType
- - - - - -类型用于导入日期和时间数据
“datetime”
(默认)|“文本”
类型导入的日期和时间数据,指定为逗号分隔的对,由“DatetimeType”
其中一个价值观是:“datetime”
或“文本”
.
价值 | 导入日期和时间数据的类型 |
---|---|
“datetime” |
MATLAB 有关更多信息,请参见 |
“文本” |
如果
|
如果指定TextscanFormats
属性包含% D
,则tabularTextdatastore
中指定的值DatetimeType
.
例子:“DatetimeType”、“datetime”
数据类型:字符
|字符串
DurationType
- - - - - -持续时间数据的输出数据类型
“持续时间”
(默认)|“文本”
输出数据类型的持续时间数据,指定为由名称-值参数组成“DurationType”
,要么“持续时间”
或“文本”
.
价值 | 导入时长数据的类型 |
---|---|
“持续时间” |
MATLAB 有关更多信息,请参见 |
“文本” |
如果
|
数据类型:字符
|字符串
DatetimeLocale
- - - - - -用于解释日期的区域
“en_US”
(默认)|特征向量|字符串标量
区域设置用于解释指定为字符向量或字符串标量的日期。的DatetimeLocale
Value决定导入函数如何解释表示日期和时间的文本。
当指定DatetimeLocale
,使用
,在那里xx
_YY
xx
是一个小写的ISO 639-1两个字母的代码,指定一种语言,和YY
是一个大写的ISO 3166-1 alpha-2代码,用于指定国家。
该表列出了区域设置的一些常用值。
语言环境 | 语言 | 国家 |
---|---|---|
“de_DE” |
德国 | 德国 |
“en_GB” |
英语 | 联合王国 |
“en_US” |
英语 | 美国 |
“es_ES” |
西班牙语 | 西班牙 |
“fr_FR” |
法国 | 法国 |
“it_IT” |
意大利 | 意大利 |
“ja_JP” |
日本 | 日本 |
“ko_KR” |
朝鲜文 | 韩国 |
“设置nl_NL” |
荷兰 | 荷兰 |
“zh_CN” |
中文(简体) | 中国 |
请注意
的语言环境
Value决定如何解释输入值。控件指定显示格式和语言语言环境选项中的Datetime格式部分的Preferences窗口。若要更改默认的datetime区域设置,请参见设置命令窗口参数.
数据类型:字符
|字符串
除了这些名称-值对之外,您还可以将该页上的属性指定为名称-值对,但是文件
财产。
属性
TabularTextDatastore
属性描述与TabularTextDatastore
对象。具体来说,属性描述了文件中数据的格式,并控制如何从数据存储中读取数据。当你创建TabularTextDatastore
对象中的第一个文件,则数据存储函数使用文件
属性来确定属性的值。除了文件
属性的值时,可以指定TabularTextDatastore
属性,在创建数据存储对象时使用名称-值对参数。要在创建对象后查看或修改属性,请使用点表示法:
ds = tabularTextDatastore(“airlinesmall.csv”);ds。TreatAsMissing =“NA”;ds。MissingValue = 0;
文件属性
文件
- - - - - -数据存储中包含的文件
字符向量的单元格数组|字符串数组
包含在数据存储中的文件,解析为字符向量的单元格数组或字符串数组,其中每个字符向量或字符串都是文件的完整路径。的位置
参数中的参数tabularTextDatastore
而且数据存储
函数定义这些文件。
属性指定的第一个文件文件
属性确定数据存储中所有文件的变量名称和格式信息。
属性的值更改时,数据存储函数将重新计算TabularTextDatastore
属性。
例子:{“C: \ dir \ data \ mydata1.csv”;“C: \ dir \ data \ mydata2.csv”}
数据类型:细胞
|字符串
FileEncoding
- - - - - -文件编码
“utf - 8”
(默认)|“us - ascii”
|“麦金塔”
|……
文件编码,指定为字符向量或类似于这些值之一的字符串标量。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
如果数据存储中的每个文件都适合内存,那么FileEncoding
Also可以是这些值之一。
|
|
|
|
|
|
|
|
|
|
|
属性的值更改时,数据存储函数将重新计算TabularTextDatastore
属性。
数据类型:字符
|字符串
ReadVariableNames
- - - - - -读取变量名
真正的
|假
读取变量名,指定为逻辑真正的
或假
.
如果未指定,则
tabularTextDatastore
函数自动检测变量名的存在。如果
真正的
,然后第一个文件的第一个非标题行确定数据的变量名。如果
假
,则第一个文件的第一个非标头行包含第一行数据。数据被分配默认变量名,Var1
,Var2
等等。
属性的值更改时,数据存储函数将重新计算TabularTextDatastore
属性。
数据类型:逻辑
VariableNamingRule
- - - - - -标记以保留变量名
“修改”
(默认)|“保存”
标记以保留变量名,指定为任意一种“修改”
或“保存”
.
“修改”
-转换无效的变量名(由isvarname
函数)到有效的MATLAB标识符。“保存”
-保留不是有效MATLAB标识符的变量名,例如包含空格和非ascii字符的变量名。
从R2019b开始,变量名和行名可以包含任何字符,包括空格和非ascii字符。此外,他们可以从任何字符开始,而不仅仅是字母。变量名和行名不必是有效的MATLAB标识符(由isvarname
功能)。若要保留这些变量名和行名,请设置值VariableNamingRule
来“保存”
.的值时,变量名不会刷新VariableNamingRule
从“修改”
来“保存”
.
数据类型:字符
|字符串
VariableNames
- - - - - -变量名
字符向量的单元格数组|字符串数组
数据存储中变量的名称,指定为字符向量的单元格数组或字符串数组。按照它们在文件中出现的顺序指定变量名。如果不指定变量名,则从数据存储的第一个文件中的第一个非标题行检测变量名。当修改VariableNames
属性时,新变量名的数量必须与原始变量名的数量匹配。
属性的金宝app值可支持无效的MATLAB标识符作为变量名,例如包含空格和非ascii字符的变量名VariableNamingRule
参数“保存”
.
如果ReadVariableNames
是假
,然后VariableNames
默认为{“Var1”、“Var2”…}
.
例子:{“时间”、“名称”、“数量”}
数据类型:细胞
|字符串
文本格式属性
NumHeaderLines
- - - - - -要跳过的行数
非负整数
文件开头要跳过的行数,指定为非负整数。如果未指定,则tabularTextDatastore
函数自动检测要跳过的行数。
的tabularTextDatastore
函数在读取变量名或数据之前忽略指定的标题行数。
属性的值更改时,数据存储函数将重新计算TabularTextDatastore
属性。
数据类型:双
分隔符
- - - - - -字段分隔符字符
特征向量|字符向量的单元格数组|字符串标量|字符串数组
字段分隔符字符,指定为字符向量、字符向量的单元格数组、字符串标量或字符串数组。在字符向量单元格数组或字符串数组中指定多个分隔符。如果未指定,则tabularTextDatastore
函数自动检测分隔符。
例子:“|”
例子:{“;”,“*”}
文件中重复的分隔符字符被解释为分隔符,分隔符之间有空字段。如果未指定,read函数默认自动检测分隔符。
当指定下列转义序列之一作为分隔符时,它将转换为相应的控制字符。
\ b |
退格 |
\ n |
换行符 |
r \ |
回车 |
\ t |
选项卡 |
\ \ |
反斜杠(\ ) |
属性的值更改时,数据存储函数将重新计算TabularTextDatastore
属性。
数据类型:字符
|细胞
|字符串
RowDelimiter
- - - - - -行分隔符
\ r \ n
(默认)|特征向量|字符串标量
行分隔符字符,指定为字符向量或字符串标量,必须是单个字符或其中之一“\ r”
,“\ n”
,或“\ r \ n”
.
属性的值更改时,数据存储函数将重新计算TabularTextDatastore
属性。
例子:”:“
数据类型:字符
|字符串
TreatAsMissing
- - - - - -作为缺失值处理的文本
""
(默认)|特征向量|字符向量的单元格数组|字符串标量|字符串数组
作为缺失值处理的文本,指定为单个字符向量、字符向量的单元格数组、字符串标量或字符串数组。指定为TreatAsMissing
中定义的值MissingValue
财产。例如,如果MissingValue
定义为a南
,以及TreatAsMissing
指定为“NA”
.然后,在导入的数据中,所有发生的“NA”
由南
.
此选项仅应用于数值字段。同样,这个属性等价于TreatAsEmpty
属性的名称-值对参数textscan
函数。
属性的值更改时,数据存储函数将重新计算TabularTextDatastore
属性。
例子:“NA”
例子:{“-””、“}
数据类型:字符
|细胞
|字符串
MissingValue
- - - - - -值,用于缺少数字字段
南
(默认)|标量
值,用于指定为标量的分隔文本文件中缺失的数字字段。这个属性等价于EmptyValue
属性的名称-值对参数textscan
函数。
数据类型:双
高级文本格式属性
TextscanFormats
- - - - - -数据字段格式
字符向量的单元格数组|字符串数组
数据字段格式,指定为字符向量的单元格数组或字符串数组,其中每个字符向量或字符串包含一个转换说明符。
属性时TextscanFormats
属性的转换说明符相同textscan
函数接受formatSpec
论点。的有效值TextscanFormats
包括使用星号(*)字符跳过字段的转换说明符和跳过文字文本的转换说明符。类型中的变量的数量必须与转换说明符的数量匹配VariableNames
财产。
如果的值
TextscanFormats
属性的值跳过使用星号(*)的字段的转换说明符SelectedVariableNames
属性自动更新。MATLAB使用% *问
属性省略的字段SelectedVariableNames
属性,并将字段内容视为文字字符向量。对于固定宽度的文件,使用适当的转换说明符和字段宽度指示跳过的字段。例如,% * 52 c
跳过包含52个字符的字段。如果没有指定值
TextscanFormats
,然后数据存储
通过扫描数据存储的第一个文件中的第一个非标题行文本来确定数据字段的格式。从R2020b开始,
数据存储
检测前缀文字作为十六进制和二进制数据。在此之前,数据存储
检测到作为文本数据的前缀文字。
例子:{“% s”、“% s”、“% f”}
数据类型:细胞
|字符串
ExponentCharacters
- - - - - -指数字
“eEdD”
(默认)|特征向量|字符串标量
指数字符,指定为字符向量或字符串标量。默认的指数字符为e
,E
,d
,D
.
数据类型:字符
|字符串
CommentStyle
- - - - - -注释字符
""
(默认)|特征向量|字符串标量|双元素数组
注释字符,用于区分文件中的注释,指定为字符向量、字符串标量或两元素字符串或单元格数组。
如果指定字符向量或字符串标量,则同一行上的所有后面的文本都将解释为注释。例如,
“CommentStyle”、“/ *”
之后解释所有文本/*
在注释的同一行上。如果指定了包含字符向量的两元素字符串向量或两元素单元格数组,则两个字符之间的所有文本都将解释为注释。例如,
“CommentStyle ",{"/*", "*/"}
解释之间的所有文本“/ *”
而且“* /”
作为一个评论。
当从TabularTextDatastore
,读
函数只在每个字段的开头检查注释,而不是在字段内检查注释。
更改此属性的值时,数据存储
函数的值重新求值TabularTextDatastore
属性。
例子:“CommentStyle ",{"/*", "*/"}
数据类型:字符
|细胞
|字符串
空格
- - - - - -空白字符
“t \ b \”
(默认)|特征向量|字符串标量
空白字符,指定为字符向量或一个或多个字符的字符串标量。
将下列转义序列之一指定为任何空白字符时,数据存储
函数将该序列转换为相应的控制字符。
\ b |
退格 |
\ n |
换行符 |
r \ |
回车 |
\ t |
选项卡 |
\ \ |
反斜杠(\ ) |
属性的值更改时,数据存储函数将重新计算TabularTextDatastore
属性。
例子:“t \ b \”
数据类型:字符
|字符串
MultipleDelimitersAsOne
- - - - - -多个分隔符处理
0(假)
(默认)|1(真正的)
多个分隔符处理,指定为任意一个真正的
或假
.如果真正的
,然后数据存储
将连续分隔符视为单个分隔符。由空格分隔的重复分隔符也被视为单个分隔符。
属性的值更改时,数据存储函数将重新计算TabularTextDatastore
属性。
属性预览
,读
,readall
表格
SelectedVariableNames
- - - - - -要读取的变量
字符向量的单元格数组|字符串数组
要从文件中读取的变量,指定为字符向量的单元格数组或字符串数组,其中每个字符向量或字符串包含一个变量的名称。可以以任意顺序指定变量名。
属性的金宝app值可支持无效的MATLAB标识符作为变量名,例如包含空格和非ascii字符的变量名VariableNamingRule
参数“保存”
.
例子:[" Var3”、“Var7”、“Var4”)
数据类型:细胞
|字符串
SelectedFormats
- - - - - -所选变量的格式
字符向量的单元格数组|字符串数组
要读取的选定变量的格式,指定为字符向量的单元格数组或字符串数组,其中每个字符向量或字符串包含一个转换说明符。要读取的变量由SelectedVariableNames
财产。字符向量或字符串的个数SelectedFormats
必须与要读取的变量数量相匹配。
类型的转换说明符可以使用相同的转换说明符textscan
函数接受,包括跳过文字文本的说明符。但是,不能使用跳过字段的转换说明符。也就是说,转换说明符不能包含星号(*)。
例子:[" % d”、“% d”)
数据类型:细胞
|字符串
ReadSize
- - - - - -要读取的数据量
20000(默认)|积极的标量|“文件”
类调用中要读取的数据量读
函数,指定为正标量或“文件”
.
如果
ReadSize
是正整数,那么每个调用到读
最多阅读ReadSize
行。如果
ReadSize
是“文件”
,然后每个呼叫到读
读取一个文件中的所有数据。
当你改变ReadSize
从数值标量到“文件”
反之亦然,MATLAB将数据存储重置为未从其中读取数据的状态。
数据类型:双
|字符
|字符串
TextType
- - - - - -文本变量的输出数据类型
“字符”
(默认)|“字符串”
输出数据类型的文本变量,指定为“字符”
或“字符串”
.TextType
指定用于格式化的文本变量的数据类型% s
,%问
,或[…]
.
如果
TextType
是“字符”
,则输出为字符向量的单元格数组。如果
TextType
是“字符串”
,则输出有type字符串
.
数据类型:字符
|字符串
RowTimes
- - - - - -行乘以变量的名称
变量名|变量指数
行次数变量的名称,指定为由“RowTimes”
和变量名(例如“日期”
)或变量索引(例如3.
).
RowTimes
与时间表相关的参数。时间表的每一行都与一个时间相关联,该时间在时间表的时间向量中捕获。中指定的变量。RowTimes
必须包含datetime
或者一个持续时间
向量。
如果的值“OutputType”
是“时间表”
,但你没有具体说明“RowTimes”
,然后TabularTextDatastore
使用第一个datetime
或持续时间
变量为时间表的行时间。
供用户使用的属性writeall
文件夹
- - - - - -用于构造数据存储的文件夹
字符向量的单元格数组
此属性是只读的。
用于构造数据存储的文件夹,作为字符向量的单元格数组返回。单元格数组以列向量为方向。每个字符向量都是指向包含数据文件的文件夹的路径。的位置
参数中的参数tabularTextDatastore
而且数据存储
函数定义文件夹
创建数据存储时。
的文件夹
属性时,将重置文件
的属性TabularTextDatastore
对象。
数据类型:细胞
金宝appSupportedOutputFormats
- - - - - -支持的写入格式金宝app
字符串行向量
此属性是只读的。
支持写入的格式,金宝app作为字符串的行向量返回。此属性指定使用时可能的输出格式writeall
从数据存储写入输出文件。
DefaultOutputFormat
- - - - - -默认输出格式
字符串标量
对象的功能
hasdata |
确定是否有数据可以读取 |
numpartitions |
数据存储分区数 |
分区 |
对数据存储进行分区 |
预览 |
预览数据存储中的数据子集 |
读 |
读取数据存储中的数据 |
readall |
读取数据存储中的所有数据 |
writeall |
将数据存储写入文件 |
重置 |
将数据存储重置为初始状态 |
变换 |
变换数据存储 |
结合 |
组合来自多个数据存储的数据 |
isPartitionable |
确定数据存储是否可分区 |
isSubsettable |
确定数据存储是否可子集 |
isShuffleable |
确定数据存储是否可洗牌 |
例子
选择要读取的变量
使用FileSet对象或文件路径,从示例文件创建一个数据存储airlinesmall.csv。
指定如何处理缺失值。只选择感兴趣的变量。
从该文件创建一个FileSet对象airlinesmall.csv
.的值创建一个数据存储“NA”
是否被视为缺失,缺失值是否被视为0
.
fs = matlab.io.datastore.FileSet(“airlinesmall.csv”);ds = tabularTextDatastore(fs,“TreatAsMissing”,“NA”,...“MissingValue”, 0);
查看数据存储中的变量。
ds。VariableNames
ans =1 x29单元格第1至5列{'年'}{'月'}{'月日'}{'周日'}{'DepTime'}第6至9列{'CRSDepTime'} {'ArrTime'} {'CRSArrTime'} {'UniqueCarrier'}第10至13列{'FlightNum'} {'TailNum'} {'ActualElapsedTime'} {'CRSElapsedTime'} 14至18列{'AirTime'} {'ArrDelay'} {'DepDelay'} {'Origin'} {'Dest'}第19至22列{'Distance'} {'TaxiIn'} {'TaxiOut'} {'Cancelled'}第23至25列{'CancellationCode'} {' '} {'CarrierDelay'}}第26至28列{'WeatherDelay'} {'NASDelay'} {'SecurityDelay'}第29列{'LateAircraftDelay'}
修改SelectedVariableNames
属性指定感兴趣的变量。
ds。SelectedVariableNames = [“年”,“月”,“取消”];
或者,您可以将数据的位置指定为文件路径。
ds = tabularTextDatastore(“airlinesmall.csv”);
使用这两种位置格式,还可以在创建数据存储时指定感兴趣的变量。
ds = tabularTextDatastore(“airlinesmall.csv”,“TreatAsMissing”,“NA”,...“MissingValue”0,“SelectedVariableNames”,[“年”,“月”,“取消”]);
指定读取数据的格式
从示例文件创建一个数据存储airlinesmall.csv
,其中包含表格数据。
ds = tabularTextDatastore(“airlinesmall.csv”,“TreatAsMissing”,“NA”,...“MissingValue”, 0);
指定感兴趣的变量。
ds。SelectedVariableNames = [“年”,“月”,“UniqueCarrier”];
查看SelectedFormats
财产。
ds。SelectedFormats
ans =1 x3单元格{'%f'} {'%f'} {'%q'}
的SelectedFormats
属性指定tabularTextDatastore
函数解释变量的格式。的一年
而且月
变量被读取为浮点值的列UniqueCarrier
变量作为文本列。
修改SelectedFormats
属性将前两个变量读取为有符号整数,将第三个变量读取为分类值。
ds。SelectedFormats = [“% d”,“% d”,“% C”];
预览数据。
T =预览(ds)
T =8×3表年月唯一承运人_________ _____________ 1987 10 PS 1987 10 PS 1987 10 PS 1987 10 PS 1987 10 PS 1987 10 PS 1987 10 PS 1987 10 PS 1987 10 PS 1987 10 PS 1987 10 PS 1987 10 PS 1987 10 PS
从表格文本数据存储返回时间表
使用OutputType
而且RowTimes
要创建的名称-值对tabulartextDatastore
返回时间表而不是表格。
为创建数据存储outages.csv
.指定“OutputType
"名值对为"时间表
".
ttds = tabularTextDatastore(“outages.csv”,“OutputType”,“时间表”);预览(运输大亨)
ans =8×5时间表OutageTime地区客户RestorationTime造成损失 ________________ _____________ ______ __________ ________________ ___________________ 2002-02-01 12:18{“西南”}458.98 - 1.8202 e + 06 2002-02-07 16:50{“暴风雪”}2003-01-23 00:49{“东南”}530.14 - 2.1204 e + 05 NaT{“暴风雪”}2003-02-07)21:15{“东南”}289.4 - 1.4294 e + 05 2003-02-17 08:14{“暴风雪”}2004-04-06 05:44{‘西方’}434.81 - 3.4037 e + 05 2004-04-06 06:10{“设备故障”}2002-03-16 06:18 186.44{“中西部”}2.1275e+05 2002-03-18 23:23{'严重风暴'}2003-06-18 02:49{'西'}00 2003-06-18 10:54{'攻击'}2004-06-20 14:39{'西'}231.29 NaN 2004-06-20 19:16{'设备故障'}2002-06-06 19:28{'西'}311.86 NaN 2002-06-07 00:51{'设备故障'}
当你没有指定的时候“RowTimes”
,tabularTextDatastore
使用第一个日期时间或持续时间变量作为行时间。在这种情况下,OutageTime
变量用于行次数。
指定“RowTimes”
选项,以使用恢复时间(RestorationTime
变量)作为行次数,而不是停电的时间。
ttds = tabularTextDatastore(“outages.csv”,“OutputType”,“时间表”,“RowTimes”,“RestorationTime”);预览(运输大亨)
ans =8×5时间表RestorationTime地区OutageTime客户造成损失 ________________ _____________ ________________ ______ __________ ___________________ 2002-02-07 16:50{“西南”}2002-02-01 12:18 458.98 - 1.8202 e + 06{“暴风雪”}NaT{“东南”}2003-01-23 00:49 530.14 - 2.1204 e + 05{“暴风雪”}2003-02-17 08:14{“东南”}2003-02-07)21:15 289.4 - 1.4294 e + 05{“暴风雪”}2004-04-06 06:10{‘西方’}2004-04-06 05:44 434.81 - 3.4037 e + 05{“设备故障”}2002-03-18 23:23{“中西部”}2002-03-16 06:18 186.44 2.1275e+05{'严重风暴'}2003-06-18 10:54{'西'}2003-06-18 02:49 00{'攻击'}2004-06-20 19:16{'西'}2004-06-20 14:39 231.29 NaN{'设备故障'}2002-06-07 00:51{'西'}2002-06-06 19:28 311.86 NaN{'设备故障'}
限制
日期时间数据,其中包含日期、月份或时区名称
en_US
不支持Locale。金宝app对于无法识别的datetime格式,请使用TextscanFormats
参数。
版本历史
在R2014b中引入
MATLAB命令
你点击了一个对应于这个MATLAB命令的链接:
在MATLAB命令窗口中输入该命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。