主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

データストア

データの大規模な集合の読み取り

関数数据存储は,大きすぎてメモリに収まらないデータの集まりのリポジトリであるデータストアを作成します。データストアを使用すると、ディスク、リモートの場所、またはデータベースの複数のファイルに格納されているデータを単一エンティティとして読み取りおよび処理できます。データが大きすぎてメモリに入らない場合は、データをインクリメンタルにインポートすることで対応するか、配列を作成してデータを操作するか,次の処理のためにmapreduceの入力としてデータストアを使用します。詳細は,データストア入門を参照してください。

関数

すべて展開する

数据存储 データの大規模な集合用のデータストアを作成
tabularTextDatastore 表形式テキストファイルのデータストア
spreadsheetDatastore スプレッドシートファイルのデータストア
imageDatastore イメージデータのデータストア
parquetDatastore 镶木地板ファイルの集合用のデータストア
fileDatastore カスタムファイルリーダーを使用するデータストア
arrayDatastore インメモリデータのデータストア
データストアのデータの読み取り
readall データストアのすべてのデータの読み取り
预览 データストア内のデータのサブセットをプレビュー
hasdata データが読み取り可能かどうかを判別
重置 データストアの初期状態へのリセット
writeall ファイルへのデータストアの書き込み
洗牌 データストア内のすべてのデータをシャッフルする
isShuffleable データストアがシャッフル可能かどうかを判別
numpartitions データストアの区画数
分区 データストアを分割する
isPartitionable データストアが分割可能かどうかを判別

関数

结合 複数のデータストアのデータを統合
变换 データストアの変換

オブジェクト

CombinedDatastore 基となる複数のデータストアから読み取ったデータを結合するデータストア
TransformedDatastore 基となるデータストアを変換するデータストア
KeyValueDatastore キーと値のペアのデータをmapreduceで使用するためのデータストア
TallDatastore 配列のチェックポイントのデータストア

クラス

すべて展開する

matlab.io.Datastore 基本データストアクラス
matlab.io.datastore.Partitionable データストアへの並列処理のサポートの追加
matlab.io.datastore.HadoopLocationBased データストアへのHadoopのサポートの追加
matlab.io.datastore.Shuffleable データストアへのシャッフルのサポートの追加
matlab.io.datastore.DsFileSet データストア内のファイルの集合用ファイルセットオブジェクト
matlab.io.datastore.DsFileReader データストア内のファイルのファイルリーダーオブジェクト
matlab.io.datastore.FileWritable ファイルの書き込みサポートをデータストアに追加する
matlab.io.datastore.FoldersPropertyProvider 文件夹プロパティのサポートをデータストアに追加する
matlab.io.datastore.FileSet データストア内のファイルの集合のファイルセット
matlab.io.datastore.BlockedFileSet ファイル内のブロックの集合に対するブロックファイルセット

トピック

データストア入門

データストアは,単一のファイルまたはファイルやデータのコレクションを読み取るオブジェクトです。

ファイル形式またはアプリケーション用のデータストアの選択

データまたはアプリケーションのファイル形式に基づいて,適切なデータストアを選択する。

大規模な表形式テキストファイルの読み取りと解析

次の例では,表形式データを含む大規模なテキストファイル用のデータストアを作成し,次にデータを1ブロックずつまたは1ファイルずつ読み取って処理する方法を説明します。

イメージファイルの読み取りおよび解析

この例では,イメージのコレクション用のデータストアの作成,イメージファイルの読み取り,ならびに色相,彩度および明度(HSV)の最大平均値をもつイメージの検出を行う方法を説明します。

キーと値のデータを含む垫ファイルの読み取りと解析

次の例では,mapreduceの出力である垫ファイル内のキーと値のペアのデータに対するデータストアを作成する方法を示します。

Hadoopシーケンスファイルの読み取りと解析

次の例では,キーと値のデータを含むシーケンスファイルのデータストアを作成する方法を示します。

リモートデータの操作

Amazon S3™,微软®Azure®存储Blob,またはHDFS™で,リモートデータを操作する。

異なるマシンまたはクラスターで処理するためのデータストアの設定

別のマシンまたはクラスターに読み込み,処理できるデータストアをマシン上で設定。

カスタムデータストアの開発

カスタムデータや独自のデータ用に完全にカスタマイズされたデータストアを作成する。

DICOMデータ用のカスタムデータストアの開発

この例では,書き込み操作をサポートするカスタムデータストアの開発方法を説明します。

カスタムデータストアのテストのガイドライン

カスタムデータストアの実装が完了したら,このテスト手順に従ってカスタムデータストアを検定します。