创建数据存储大型数据集合
创建一个数据存储与样品相关文件airlinesmall.csv
。这个文件包含航空数据从1987年到2008年。
管理的缺失数据导入数字列,使用“TreatAsMissing”
和“MissingValue”
名称-值对参数。取代的每个实例“NA”
0的进口数据通过指定的值“TreatAsMissing”
作为“NA”
和的值“MissingValue”
为0。
ds =数据存储(“airlinesmall.csv”,“TreatAsMissing”,“NA”,…“MissingValue”,0)
ds = TabularTextDatastore属性:文件:{"…/猛击/棒/ Bdoc21a /构建/ matlab工具箱/ matlab /演示/ airlinesmall。csv”}文件夹:{' / mathworks /猛击/棒/ Bdoc21a /构建/ matlab工具箱/ matlab /演示'}FileEncoding:“utf - 8”AlternateFileSystemRoots: {} VariableNamingRule:“修改”ReadVariableNames:真VariableNames:{“年”、“月”、“DayofMonth”……和26}DatetimeLocale: en_US文本格式属性:NumHeaderLines: 0分隔符:”、“RowDelimiter:“\ r \ n”TreatAsMissing:“NA”MissingValue: 0高级文本格式属性:TextscanFormats: {% f ', ' % f ', ' % f '……和26}TextType:“字符”ExponentCharacters: eEdD CommentStyle:”空白:“\ b \ t”MultipleDelimitersAsOne:假控制表的属性返回的预览,阅读,readall: SelectedVariableNames:{“年”、“月”、“DayofMonth”……和26}SelectedFormats: {% f ', ' % f ', ' % f '……和26}ReadSize: 20000行OutputType:“表”RowTimes:[]编写特殊属性:SupportedOutputFormats:[“三种”“csv”“xlsx”“xl金宝apps”“铺”“parq”] DefaultOutputFormat:“三”
数据存储
创建一个TabularTextDatastore
。
创建一个包含所有数据存储.tif
在MATLAB®文件路径和它的子文件夹。
ds =数据存储(fullfile (matlabroot,“工具箱”,matlab的),…“IncludeSubfolders”,真的,“FileExtensions”,“.tif”,“类型”,“图像”)
ds = ImageDatastore属性:文件:{“…\ matlab \ matlab工具箱\ \ demo \ example.tif”;matlab’……\ \ matlab工具箱\ \ imagesci \玉米。tif} ReadSize: 1标签:{}ReadFcn: @readDatastoreImage
位置
- - - - - -文件或文件夹中包含数据存储DsFileSet
对象文件或文件夹包括在数据存储中,路径或一个指定的DsFileSet
对象。
路径——指定路径作为特征向量,单元阵列的特征向量,字符串标量、数组或字符串,包含文件或文件夹的位置是本地的还是远程的。
本地文件或文件夹-指定位置
作为一个本地文件或文件夹路径。如果文件不在当前文件夹,然后本地路径必须指定完整或相对路径。指定文件夹的子文件夹内文件不会自动包含在数据存储中。您可以使用通配符(*)时指定的本地路径。这个角色指定数据存储包括所有匹配的文件或匹配所有文件文件夹。
远程文件或文件夹-指定位置
将文件或文件夹的完整路径作为一个统一资源定位符(URL)的形式hdfs: / / / path_to_file
。有关更多信息,请参见使用远程数据。
DsFileSet
对象——你也可以指定位置
作为一个DsFileSet
对象。有关更多信息,请参见matlab.io.datastore.DsFileSet
。
当位置
代表了数据存储中只包含一个文件夹,文件格式和忽略任何其他格式的支持。金宝app指定一个自定义列表的文件扩展名,包括数据存储,看到FileExtensions
财产。
为KeyValueDatastore
文件必须mat文件或文件生成的序列mapreduce
函数。mat文件必须在一个本地文件系统或网络文件系统。序列文件可以在本地网络或HDFS™文件系统。为DatabaseDatastore
位置参数不需要文件。有关更多信息,请参见DatabaseDatastore
(数据库工具箱)。
例子:“file1.csv”
例子:“. . / dir /数据/ file1.jpg”
例子:{“C: \ dir \ data \ file1.xls”,“C: \ dir \ data \ file2.xlsx”}
例子:“C: \ dir \ data \ * .mat’
例子:“hdfs: / / /数据/中”
指定可选的逗号分隔条名称,值
参数。的名字
参数名称和吗价值
相应的价值。的名字
必须出现在引号。您可以指定几个名称和值对参数在任何顺序Name1, Value1,…,的家
。
FileExtensions, {“jpg”、“.tif”}
包括所有扩展jpg
或.tif
扩展为一个ImageDatastore
对象。
“类型”
- - - - - -类型的数据存储“tabulartext”
|“图像”
|“表格”
|“keyvalue”
|“文件”
|“高”
|……类型的数据存储,指定为逗号分隔组成的“类型”
和下列之一:
的价值“类型” |
描述 |
---|---|
“tabulartext” |
文本文件包含表格数据。数据的编码必须ASCII或utf - 8。 |
“图像” |
图像文件的格式,比如JPEG或PNG。可接受的文件包括imformats 格式。 |
“表格” |
电子表格文件包含一个或多个表。 |
“keyvalue” |
mat文件中包含的键-值对数据或序列生成的文件数据mapreduce 。 |
“文件” |
自定义格式文件,需要指定阅读函数来读取数据。有关更多信息,请参见FileDatastore 。 |
“高” |
mat文件或文件产生的序列写 的函数高 数据类型。看到的更多信息,TallDatastore 。 |
“铺” |
镶木地板文件包含用于数据。看到的更多信息,ParquetDatastore 。 |
“数据库” |
数据存储在数据库中。需要数据库工具箱™。当使用的规范需要额外的输入参数类型 参数。有关更多信息,请参见DatabaseDatastore (数据库工具箱)。 |
如果有多个类型,支持的格式文件,然后使用金宝app“类型”
参数指定一个数据存储类型。
如果你不指定一个值“类型”
,然后数据存储
自动确定合适的类型的数据存储创建基于文件的扩展。
数据类型:字符
|字符串
“IncludeSubfolders”
- - - - - -包括子文件夹在文件夹内真正的
或假
|0或1包括子文件夹在一个文件夹中,指定为逗号分隔组成的“IncludeSubfolders”
和真正的
(1)或假
(0)指定真正的
包括每个文件夹内的所有文件和子文件夹假
只包括每个文件夹内的文件。
当你没有指定“IncludeSubfolders”
,那么默认值是假
。
的“IncludeSubfolders”
名称-值对只在创建这些对象有效:
TabularTextDatastore
ImageDatastore
SpreadsheetDatastore
FileDatastore
KeyValueDatastore
ParquetDatastore
例子:“IncludeSubfolders”,真的
数据类型:逻辑
|双
“FileExtensions”
- - - - - -扩展名的文件扩展的文件,指定为逗号分隔组成的“FileExtensions”
一个特征向量,单元阵列特征向量,标量字符串或字符串数组。当指定“FileExtensions”
还,指定“类型”
。您可以使用空引用”
代表文件没有扩展。
如果“FileExtensions”
没有指定,那么数据存储
自动包括所有支持文件扩展名根据数据存储类型。金宝app如果你想有不支持的扩展,然后单独指定每个扩展要包括金宝app。
为TabularTextDatastore
对象,包括支持扩展金宝app. txt
,. csv
,.dat
,.dlm
,.asc
,。text
,没有扩展。
为ImageDatastore
对象,包括所有支持金宝app扩展imformats
扩展。
为SpreadsheetDatastore
对象,包括支持扩展金宝appxls
,.xlsx
,.xlsm
,.xltx
,.xltm
。
为TallDatastore
对象,包括支持扩展金宝app.mat
和.seq
。
为ParquetDatastore
对象,包括支持扩展金宝app.parquet
和.parq
。
的“FileExtensions”
名称-值对只在创建这些对象有效:
TabularTextDatastore
ImageDatastore
SpreadsheetDatastore
FileDatastore
KeyValueDatastore
ParquetDatastore
例子:“FileExtensions”、“jpg”
例子:FileExtensions, {' . txt ', '。text '}
数据类型:字符
|细胞
|字符串
“AlternateFileSystemRoots”
- - - - - -替代的文件系统根路径替代的文件系统根路径,指定为逗号分隔组成的“AlternateFileSystemRoots”
和一个字符串向量或一个单元阵列。使用“AlternateFileSystemRoots”
当您创建一个数据存储在本地机器上,但需要在另一台机器上访问和处理数据(可能是不同的操作系统)。另外,当处理数据使用并行计算工具箱™和MATLAB®并行服务器™,数据存储在您的本地机器复制的数据在不同的平台上云或集群机器,您必须使用“AlternateFileSystemRoots”
把根路径。
把一组相当于一根路径,指定“AlternateFileSystemRoots”
作为字符串向量。例如,
[" Z: \数据集”、“/ mynetwork /数据集”)
把多个根集数据存储路径是等价的,指定“AlternateFileSystemRoots”
作为一个单元阵列包含多个行,每一行表示一组等价的根路径。指定单元阵列中的每一行作为一个字符串向量或单元阵列的特征向量。例如:
指定“AlternateFileSystemRoots”
作为一个字符串向量的单元阵列。
{[Z: \“数据集”、“/ mynetwork /数据集”);…[" Y: \数据集”、“/ mynetwork2 /数据集”、“年代:\数据集”)}
另外,指定“AlternateFileSystemRoots”
作为一个单元阵列单元阵列的特征向量。
{{“Z: \数据集”、“mynetwork /数据集”},…{“Y: \数据集”,“mynetwork2 /数据集”,年代:\数据集的}}
的价值“AlternateFileSystemRoots”
必须满足以下条件:
包含一个或多个行,每一行指定一组等价的根路径。
每一行指定多个根路径和每个根路径必须包含至少两个字符。
根路径都是独一无二的,没有子文件夹。
包含至少一个根路径条目指向文件的位置。
有关更多信息,请参见为处理在不同的机器上或设置数据存储集群。
例子:[" Z: \数据集”、“/ mynetwork /数据集”)
数据类型:字符串
|细胞
“TextType”
- - - - - -输出文本变量的数据类型“字符”
(默认)|“字符串”
输出文本变量的数据类型,指定为逗号分隔组成的“TextType”
,要么“字符”
或“字符串”
。如果输出表的读
,readall
,或预览
函数包含文本变量“TextType”
指定这些变量的数据类型TabularTextDatastore
和SpreadsheetDatastore
只有对象。如果“TextType”
是“字符”
,然后输出单元阵列的特征向量。如果“TextType”
是“字符串”
,然后输出类型字符串
。
数据类型:字符
|字符串
“DatetimeType”
- - - - - -进口日期和时间数据类型“datetime”
(默认)|“文本”
对进口日期和时间数据类型,指定为逗号分隔组成的“DatetimeType”
这些值之一:“datetime”
或“文本”
。的“DatetimeType”
参数只适用于创建一个TabularTextDatastore
对象。
价值 | 进口日期和时间数据类型 |
---|---|
“datetime” |
MATLAB 有关更多信息,请参见 |
“文本” |
如果
|
例子:“DatetimeType”、“日期时间的
数据类型:字符
|字符串
“DurationType”
- - - - - -输出数据类型的时间数据“持续时间”
(默认)|“文本”
从文本文件输出数据类型的时间数据,指定为逗号分隔组成的“DurationType”
,要么“持续时间”
或“文本”
。
价值 | 对进口持续时间数据的类型 |
---|---|
“持续时间” |
MATLAB 有关更多信息,请参见 |
“文本” |
如果
|
数据类型:字符
|字符串
|datetime
“VariableNamingRule”
- - - - - -国旗保存变量名“修改”
(默认)|“保存”
除了这些名称-值对,您还可以指定下列对象属性的名称-值对,除了文件
属性:
ds
——数据存储的数据的集合TabularTextDatastore
|ImageDatastore
|SpreadsheetDatastore
|KeyValueDatastore
|FileDatastore
|TallDatastore
|……数据存储的数据的集合,作为其中一个返回对象:TabularTextDatastore
,ImageDatastore
,SpreadsheetDatastore
,KeyValueDatastore
,FileDatastore
,TallDatastore
,ParquetDatastore
,或DatabaseDatastore
。数据存储的类型取决于类型的文件或位置
论点。有关更多信息,请单击下面的表中的数据存储名称:
类型 | 输出 |
---|---|
文本文件 | TabularTextDatastore |
图像文件 | ImageDatastore |
电子表格文件 | SpreadsheetDatastore |
mat文件或文件所产生的序列mapreduce |
KeyValueDatastore |
自定义格式文件 | FileDatastore |
mat文件或文件产生的序列写 的函数高 数据类型。 |
TallDatastore |
镶花的文件 | ParquetDatastore |
数据库 | DatabaseDatastore (数据库工具箱) |
对于每一个数据存储类型,文件
属性是一个单元阵列的特征向量。每个字符向量是一个绝对路径的文件解决位置
论点。
CombinedDatastore
|fileDatastore
|imageDatastore
|imformats
|javaaddpath
|mapreduce
|parquetDatastore
|spreadsheetDatastore
|tabularTextDatastore
|高
|TransformedDatastore
如果dispone di una versione modificata di questo esempio。Desideri aprire questo esempio con le modifiche星期二吗?
海脂肪clic苏联合国collegamento切corrisponde questo第一MATLAB:
Esegui il第一inserendolo所以nella隙缝di第一MATLAB。我浏览器web非supportano金宝app comandi MATLAB。
你也可以从下面的列表中选择一个网站:
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。