带有自定义文件阅读器的数据存储
使用一个FileDatastore
对象来管理自定义格式文件的大型集合,其中集合不一定适合内存,或者大型自定义格式文件不适合内存。你可以创建一个FileDatastore
对象。fileDatastore
函数,指定其属性,然后使用对象函数导入和处理数据。
hasdata |
确定是否有数据可供读取 |
numpartitions |
数据存储分区数 |
分区 |
对数据存储分区 |
预览 |
预览数据存储中的数据子集 |
读 |
读取数据存储中的数据 |
readall |
读取数据存储中的所有数据 |
writeall |
将数据存储写入文件 |
重置 |
将数据存储重置为初始状态 |
变换 |
变换数据存储 |
结合 |
合并来自多个数据存储的数据 |
isPartitionable |
确定数据存储是否可分区 |
isShuffleable |
确定数据存储是否可洗牌 |
洗牌 |
Shuffle数据存储中的所有数据 |
子集 |
创建数据存储或文件集的子集 |
要使用子集
和洗牌
a上的函数FileDatastore
对象,您必须设置“ReadMode”
来“文件”
。