主要内容

TallDatastore

数据存储的检查点数组

描述

TallDatastore对象为重建从二进制文件写入磁盘阵列函数。您可以使用对象重新创建原始数组,或者你可以通过指定访问和管理数据TallDataStore使用对象属性和功能。

创建

创建TallDatastore对象的使用数据存储函数。例如,tds =数据存储(位置、“类型”、“高”)创建一个数据存储从指定的文件的集合位置

属性

全部展开

文件包含在数据存储、解析为特征向量,单元阵列的特征向量,字符串标量、向量或字符串或字符串数组,其中每个字符是一个文件的完整路径。

位置论点的数据存储函数定义文件属性创建数据存储时。的位置参数包含本地文件系统上的文件的完整路径,一个网络文件系统,或受支持的远程位置如Amazon S3™, Windows Azure金宝app®Blob存储和HDFS™。有关更多信息,请参见使用远程数据

文件必须mat文件或文件生成的序列函数。

例子:[" C: \ dir \ data \ file1.ext”;“C: \ dir \ data \ file2.ext”)

例子:[" s3: / / bucketname / path_to_files / your_file01.ext”;“s3: / / bucketname / path_to_files / your_file02.ext”)

数据类型:字符|细胞|字符串

文件类型,指定为“垫”mat文件或“>”序列文件。默认情况下,文件的类型决定了所提供的位置文件类型

数据类型:字符|字符串

最大数量的数据行读入一个调用预览函数,指定为一个正整数。当数据存储函数创建一个TallDatastore,它决定和分配的最佳值ReadSize

替代的文件系统根路径,指定为名称参数组成的“AlternateFileSystemRoots”和一个字符串向量或一个单元阵列。使用“AlternateFileSystemRoots”当您创建一个数据存储在本地机器上,但需要在另一台机器上访问和处理数据(可能是不同的操作系统)。另外,当处理数据使用并行计算工具箱™和MATLAB®并行服务器™,数据存储在您的本地机器复制的数据在不同的平台上云或集群机器,您必须使用“AlternateFileSystemRoots”把根路径。

  • 把一组相当于一根路径,指定“AlternateFileSystemRoots”作为字符串向量。例如,

    [" Z: \数据集”、“/ mynetwork /数据集”)

  • 把多个根集数据存储路径是等价的,指定“AlternateFileSystemRoots”作为一个单元阵列包含多个行,每一行表示一组等价的根路径。指定单元阵列中的每一行作为一个字符串向量或单元阵列的特征向量。例如:

    • 指定“AlternateFileSystemRoots”作为一个字符串向量的单元阵列。

      {[Z: \“数据集”、“/ mynetwork /数据集”);…[" Y: \数据集”、“/ mynetwork2 /数据集”、“年代:\数据集”)}

    • 另外,指定“AlternateFileSystemRoots”作为一个单元阵列单元阵列的特征向量。

      {{“Z: \数据集”、“mynetwork /数据集”},…{“Y: \数据集”,“mynetwork2 /数据集”,年代:\数据集的}}

的价值“AlternateFileSystemRoots”必须满足以下条件:

  • 包含一个或多个行,每一行指定一组等价的根路径。

  • 每一行指定多个根路径和每个根路径必须包含至少两个字符。

  • 根路径都是独一无二的,没有子文件夹。

  • 包含至少一个根路径条目指向文件的位置。

有关更多信息,请参见为处理在不同的机器上或设置数据存储集群

例子:[" Z: \数据集”、“/ mynetwork /数据集”)

数据类型:字符串|细胞

对象的功能

hasdata 确定数据可用来读
numpartitions 数量的数据存储分区
分区 分区数据存储
预览 预览数据存储中数据的子集
在数据存储中读取数据
readall 读取所有数据存储中的数据
重置 数据存储重置为初始状态
变换 变换数据存储
结合 合并来自多个数据存储的数据
isPartitionable 确定是否可分区的数据存储
isSubsettable 确定是否subsettable数据存储
isShuffleable 确定是否shuffleable数据存储

例子

全部折叠

使用TallDatastore对象重建高数组直接从磁盘上的文件,而不是重新执行的所有命令,产生高的数组。创建一个高大数组并将其保存到磁盘函数。检索数组的使用数据存储然后将其转换回

创建一个简单的高两倍。

t =高(rand (500,1))
t = 500×1高双列向量0.8147 0.9058 0.1270 0.9134 0.6324 0.0975 0.2785 0.5469::

将结果保存到一个新文件夹命名Example_Folder

位置= fullfile (matlabroot,“工具箱”,“matlab”,“演示”,“Folder1”);写(位置、t);
高数据写入文件夹H: \ matlab \ matlab工具箱\ \ demo \ Folder1评估高表达式使用本地matlab会话:-通过1对1:在0.063秒完成评估在0.16秒完成

恢复数组写入磁盘,首先创建一个新的数据存储引用相同的目录中。然后将数据存储到一个数组中。

tds =数据存储(位置);t1 =高(tds)
t1 = M×1高双列向量0.8147 0.9058 0.1270 0.9134 0.6324 0.0975 0.2785 0.5469::

版本历史

介绍了R2016b