这数据存储
函数创建一个数据存储,它是用于集合的存储库,其无法适合内存。数据存储允许您读取和处理存储在磁盘,远程位置或数据库中的多个文件中的数据作为单个实体。如果数据太大而无法适合内存,则可以管理数据的增量导入,创建一个高
数组来处理数据,或者使用数据存储作为输入mapreduce
为了进一步处理。有关更多信息,请参阅开始使用数据存储。
数据存储是用于读取单个文件或文件或数据集合的对象。
根据数据或应用程序的文件格式选择正确的数据存储。
此示例显示如何为包含表格数据的大文本文件创建数据存储,然后一次读取和处理数据一个块或一次一个文件。
此示例显示如何为图像集合创建数据存储,读取图像文件,并找到具有最大平均色调,饱和度和亮度(HSV)的图像。
此示例显示如何在遥控器中创建一个用于键值对数据的数据存储,该数据是输出的mapreduce
。
这个示例展示了如何为包含键值数据的Sequence文件创建数据存储。
在Amazon S3™和Azure中使用远程数据®Blob Storage或HDFS™。
设置可以在另一台计算机或群集上加载和处理的计算机上的数据存储。
为您的自定义或专有数据创建完全自定义的数据存储。
此示例显示如何开发支持写入操作的自定义数据存储。金宝app
实现自定义数据存储后,请按照此测试过程进行限定您的自定义数据存储。