データストア

データの大規模な集合の読み取り

関数数据存储は,大きすぎてメモリに収まらないデータの集まりのリポジトリであるデータストアを作成します。データストアを使用すると、ディスク、リモートの場所、またはデータベースの複数のファイルに格納されているデータを単一エンティティとして読み取りおよび処理できます。データが大きすぎてメモリに入らない場合は、データをインクリメンタルにインポートすることで対応するか、高配列を作成してデータを操作するか,次の処理のためにmapreduceの入力としてデータストアを使用します。詳細は,データストア入門を参照してください。

関数

すべて展開する

データストアの作成

`数据存储`	データの大規模な集合用のデータストアを作成
`tabularTextDatastore`	表形式テキストファイルのデータストア
`spreadsheetDatastore`	スプレッドシートファイルのデータストア
`imageDatastore`	イメージデータのデータストア
`parquetDatastore`	镶木地板ファイルの集合用のデータストア
`fileDatastore`	カスタムファイルリーダーを使用するデータストア
`arrayDatastore`	インメモリデータのデータストア

データストアの読み取りと書き込み

`读`	データストアのデータの読み取り
`readall`	データストアのすべてのデータの読み取り
`预览`	データストア内のデータのサブセットをプレビュー
`hasdata`	データが読み取り可能かどうかを判別
`重置`	データストアの初期状態へのリセット
`writeall`	ファイルへのデータストアの書き込み

データストアの分割とシャッフル

`洗牌`	データストア内のすべてのデータをシャッフルする
`isShuffleable`	データストアがシャッフル可能かどうかを判別
`numpartitions`	データストアの区画数
`分区`	データストアを分割する
`isPartitionable`	データストアが分割可能かどうかを判別

データストアの連結または変換

関数

`结合`	複数のデータストアのデータを統合
`变换`	データストアの変換

オブジェクト

`CombinedDatastore`	基となる複数のデータストアから読み取ったデータを結合するデータストア
`TransformedDatastore`	基となるデータストアを変換するデータストア

MapReduceおよび高配列との統合

`KeyValueDatastore`	キーと値のペアのデータを`mapreduce`で使用するためのデータストア
`TallDatastore`	`高`配列のチェックポイントのデータストア

クラス

すべて展開する

カスタムデータストアの開発

`matlab.io.Datastore`	基本データストアクラス
`matlab.io.datastore.Partitionable`	データストアへの並列処理のサポートの追加
`matlab.io.datastore.HadoopLocationBased`	データストアへのHadoopのサポートの追加
`matlab.io.datastore.Shuffleable`	データストアへのシャッフルのサポートの追加
`matlab.io.datastore.DsFileSet`	データストア内のファイルの集合用ファイルセットオブジェクト
`matlab.io.datastore.DsFileReader`	データストア内のファイルのファイルリーダーオブジェクト
`matlab.io.datastore.FileWritable`	ファイルの書き込みサポートをデータストアに追加する
`matlab.io.datastore.FoldersPropertyProvider`	文件夹プロパティのサポートをデータストアに追加する
`matlab.io.datastore.FileSet`	データストア内のファイルの集合のファイルセット
`matlab.io.datastore.BlockedFileSet`	ファイル内のブロックの集合に対するブロックファイルセット