主要内容

このページの翻訳は最新ではありません。ここをクリックして,英语の最新版を参照してください。

数据存储

データの大规模な集合用のデータストアを作成

说明

DS.=数据存储(地点は,地点で指定されたののからからデータストアをししとは,大声すぎてメモリ收まらないのコレクションを格式したリポジトリですですですですですですですですですですですですですです。DS.の作物成后,データデータを読み取ってててできでき。

DS.=数据存储(地点名称,价值は,1つ以上の名前と値のペアの引数を使用して,DS.に追加のパラメーターを指定します。たとえば,“类型”,“图像”を指定して,イメージファイルのデータストアを作成できます。

すべて折りたたむ

サンプルファイルAirlinesmall.csv.この关节付けたストアをを作作作作作作作后,1987年から2008年までの航空会のデータ格式されています。

数値列の欠损データのインポートを管理するには,名前と値のペアの引数'TreatAsMissing'および'MissingValue'を使用します。'TreatAsMissing'の値を'na''MissingValue'の値を0に指定して,インポートデータで'na'のすべてのインスタンスを0に置き换えます。

DS =数据存储区('airlinesmall.csv''TreatAsMissing''na'......'MissingValue',0)
ds = tabulartextdataStore具有属性:文件:{'... / devel / bat / bdoc20b / build / matlab / toolbox / matlab / demos / airlinesmall.csv'}文件夹:{'/ mathworks / devel / bat / bdoc20b / build /matlab / toolbox / matlab / demos'} fileencoding:'utf-8'lexeryfilesystemroots:{variablenamingrule:en_us文本格式属性:numheaderlines:0 delimiter:','rowdelimiter:'\ r \ n'instamissing:'na'遗漏:0高级文本格式属性:textscanformats:{'%f','%f','%f','%f'...和26更多} texttype:'char'exponentcharacters:'eedd'commentstyle:'fhiteSpace:'\ b \ t'multipledelimitersasone:false属性控制通过预览,read,readall:selectedvariablenames返回的表返回的表:{'年','月','Dayofmonth'......和26更多}所选择的格式:{'%f','%f','%f'...和26更多} readsize:20000行outputtype:'表'rowtimes:[]写特定属性:supportedOutputfo金宝apprmats:[“txt”“csv”“xlsx”“xls”“镶木条”“parq”] defaultOutputFormat:“TXT”

数据存储tabulartextdatastore.を作成します。

MATLAB®パスおよびそのサブフォルダー内にあるすべての.tif.ファイルを含む含むデータデータ作作作者

ds = datastore(fullfile(matlabroot,'工具箱''matlab'),......'insertumbfolders', 真的,'fileextensions''.tif''类型''图像'
DS = ImageageAtastore具有属性:文件:{'... \ matlab \ toolbox \ matlab \ demos \ example.tif';'... \ matlab \ toolbox \ matlab \ imagesci \ corn.tif'} readsize:1标签:{} readfcn:@readdataStoreimage

入力数

すべて折りたたむ

データストアに含めるファイルまたはフォルダー。パスまたはDsFileSetオブジェクトとして指定します。

  • パス - ローカルやリモートのファイルまたはフォルダーの场所を含む文字ベクトル,文字ベクトルの细胞配列,串スカラー,または串配列としてパスを指定します。

    • ローカルのファイルまたはフォルダー - ファイルまたはフォルダーのローカルパスとして地点を指定します。ファイルが现处于のフォルダーに在ししない场绝対パスまたはパス指定しばばませんファイルフォルダーサブフォルダーフォルダーあるファイルははフォルダー内ははははははははははは含まれません。ローカルローカルパスを指定するときにワイルド文章(*)ををは,一切するフォルダーにある,すべてのファイルまたはするすべてのをデータストアに含めることをを指定します。

    • リモートのファイルまたはフォルダー -地点HDFS:/// path_to_fileのの形式统一资源定位器(URL)として,ファイルまたはフォルダーの绝対に指定ます。详细については。リモートデータの操作を参照してください。

  • DsFileSetオブジェクト -地点DsFileSetオブジェクトオブジェクトとして指定するすることできできできについてについて,matlab.io.datastore.dsfileset.を参照してください。

地点がフォルダーを表す场合,データストアにはサポートされているファイル形式のみが含まれ,その他の形式は无视されます。データストアに含めるファイル拡张子のカスタムリストを指定するには,FileExtensionsプロパティを参照してください。

KeyValueDatastoreの结合,ファイルは关流Mapreduce.で生成されたMATファイルまたはシーケンスファイルでなければなりません.MATファイルはローカルファイルシステムまたはネットワークファイルシステムになければなりません。シーケンスファイルは,ローカル,ネットワークまたはHDFS™のファイルシステムに配置できます。DatabaseDatastoreの场合,引数位置がファイルである必要はありません。详细については,DatabaseDatastore(数据库工具箱)を参照してください。

例:'file1.csv'

例:'../dir/data/file1.jpg'

例:{'c:\ dir \ data \ file1.xls','c:\ dir \ data \ file2.xlsx'}

例:'c:\ dir \ data \ *。垫子'

例:'hdfs:///data/file1.txt'

名称と値のペアペアの数

オプションの名称,价值の驰数ペアをコンマ区切りで指定します。名称は引数名で,价值は対応する値です。名称はは用符符で囲まなけれなけれなりませませませなりませませname1,value1,...,namen,valuenのように,复数の名前と値のペアの引数を任意の顺序で指定できます。

例:'FileExtensions',{ 'JPG', 'TIF'}は,imageageAtastore.オブジェクトについて,.jpg.または.tif.のの张子をもつのファイルファイルをます。

データストアの种类。'类型'と次のいずれかで构成されるコンマ区切りのペアとして指定します。

'类型'の値 说明
'tabulartext' 表形式データ含むファイルファイル。データのエンコードはasciiまたはutf-8でなければなりません。
'图像' JPEGやPNGなどの形式のイメージファイル。使用できるファイルにはimformats.形式が含まれます。
“电子表格” 1つ以上のシートを含むスプレッドシートファイル。
'核心价值' MATファイルまたはシーケンスファイルに含まれ,Mapreduce.で生成したをもつキーと値のペアののデータ。
'文件' 详细データについて必要は形式形式についてについては形式についてについてはについてについてについてはについてについてははについてについてはについてについてははについてのについてはについてについてfiledatastore.を参照してください。
'高的' 高的データ型の关によって生成さされたたファイルまたはシーケンス。详细详细について,塔塔塔斯特雷を参照してください。
“实木复合地板” 列方向データを含む镶木ファイル。详细については,ParquetDatastoreを参照してください。
'数据库' データベースに保存されデータ.database toolbox™が必要です。类型パラメーターを使用する场合は,追加の入力引数を指定する必要があります。详细については,DatabaseDatastore(数据库工具箱)を参照してください。
  • ファイル形式をサポートする种类が复数ある场合は,引数'类型'をを用してデータストア种类种类を指定します。

  • '类型'の値を指定しない场合,作成するデータストアの适切な种类はファイルの拡张子に基づいて数据存储により自动的に判别されます。

データ型:char|细绳

フォルダー内のサブフォルダーを含めるかどうか。'insertumbfolders'と,真的(1)または错误的(0)でで成される区切り切りのペアとして指定ししフォルダー内のすべてののとサブフォルダーを含めるにににとサブフォルダーをを含めるに真的を指定し,各フォルダー内のファイルのみをには错误的を指定します。

'insertumbfolders'を指定しない场合,既定値は错误的です。

'insertumbfolders'の名前と値のペア,次のオブジェクトを作用成する合并にのみです。

  • tabulartextdatastore.

  • imageageAtastore.

  • SpreadsheetDatastore

  • filedatastore.

  • KeyValueDatastore

  • ParquetDatastore

例:'insertumubfolders',真实

データ型:逻辑|双倍的

ファイルの拡张子。'fileextensions'と,文字ベクトル,文字ベクトルの细胞配列,字符串スカラーまたは串配列で构成されるコンマ区切りのペアとして指定します。'fileextensions'を指定する场合'类型'も指定します。空の引用符''を张子て,拡张子のないファイルをことができことができます。

'fileextensions'を指定しない场合,データストアの种类に応じて,サポートされるすべてのファイル拡张子が数据存储により自动的に含められます。サポートされていない拡张子を含める场合は,含める拡张子を个々に指定します。

  • tabulartextdatastore.オブジェクトオブジェクトの合,サポートされる拡张子には。文本.csv..DAT.dlm.sc.および。文本が含まれます。また,拡张子がない场合もサポートされます。

  • imageageAtastore.オブジェクトの结合,サポートされる拡张子にはすべてimformats.が含まれます。

  • SpreadsheetDatastoreオブジェクトオブジェクトの合,サポートされる拡张子には.xls..xlsx..xlsm..xltx.および.xltm.が含まれます。

  • 塔塔塔斯特雷オブジェクトオブジェクトの合,サポートされる拡张子には。垫および.SEQが含まれます。

  • ParquetDatastoreオブジェクトオブジェクトの合,サポートされる拡张子には.parquetおよび.parq.が含まれます。

'fileextensions'の名前と値のペア,次のオブジェクトを作用成する合并にのみです。

  • tabulartextdatastore.

  • imageageAtastore.

  • SpreadsheetDatastore

  • filedatastore.

  • KeyValueDatastore

  • ParquetDatastore

例:'fileextensions','。jpg'

例:'fileextensions',{'。txt','。文本'}

データ型:char|细胞|细绳

代替ファイルシステムのルートパス。'AlternateFileSystemRoots'と字符串ベクトルまたは细胞配列で构成される区切りのペアとしてしますますますますますますますます。ローカルマシン上にストアををを。别别マシン(异なるのマシン可性が)上でデータにアクセスして管理する必要があるある合并,'AlternateFileSystemRoots'また,并行计算工具箱™と马铃薯®并行服务器™を使用してデータを处理し,そのデータがローカルマシンに保存され,そのデータのコピーが异なるプラットフォームのクラウドやクラスターマシンにある场合,'AlternateFileSystemRoots'をを用してルートパス关键词连付けばなりません。

  • 相互に対応する1组のルートパスを关连付けるには,'AlternateFileSystemRoots'を字符串ベクトルとして指定します。以下に例をます。

    [ “Z:\数据集”, “/的MyNetwork /数据集”]

  • データデータストアに対応対応する复の组のルートパスををに,复数行を含む细胞配列配列'AlternateFileSystemRoots'を指定します。各行は対応するルートパスの组を表します。细胞配列内の各行を串ベクトル,または文字ベクトルの细胞配列のいずれかとして指定します。以下に例を示します。

    • 'AlternateFileSystemRoots'を串ベクトルの细胞配列として指定します。

      {[“z:\ datasets”,“/ mynetwork / datasets”]; ... [y:\ datasets“,”/ mynetwork2 / datasets“,”s:\ datasets“]}

    • あるいは,'AlternateFileSystemRoots'を文字ベクトルの细胞配列からなる细胞配列として指定します。

      {{'z:\ datasets','/ mynetwork / datasets'}; ... {'y:\ datasets','/ mynetwork2 / datasets','s:\ datasets'}}

'AlternateFileSystemRoots'の値は,次の条件を満たさなけれなりません。

  • 1行以上の行を含み,各行は1组の対応するルートパスを指定する。

  • 各行は复数のルートパスを指定し,各ルートパスは2文字以上を含まなければならない。

  • ルートパスは一意で,他のルートパスのサブフォルダーではない。

  • ファイルファイルの场所を指す指すつ上のルートパスエントリ含む含む。

详细については,异なるマシンまたはクラスターで处理するためのデータストアの设定を参照してください。

例:[ “Z:\数据集”, “/的MyNetwork /数据集”]

データ型:细绳|细胞

テキスト変数の出力データ型。'texttype''char'または'细绳'のいずれかで构成されるコンマ区切りのペアとして指定します。关数读物または预习の出力テーブルにテキスト変数が含まれる场合,'texttype'は,tabulartextdatastore.オブジェクトおよびSpreadsheetDatastoreオブジェクトについてのみ,それらの変数のデータ型を指定します。'texttype''char'のの合,出力は文章ベクトルベクトル细胞配列です。'texttype''细绳'の结合,出力の型は细绳です。

データ型:char|细绳

インポートされる日付时钟ののの型。'DatetimeType'と,'约会时间'または'文本'のいずれかの値で构成されるコンマ区切りのペアとして指定します。'DatetimeType'引数は,tabulartextdatastore.オブジェクトを作成する场合にのみ适用されます。

インポートされる日付と时钟のデータの型
'约会时间'

MATLABの约会时间データ型

详细については,约会时间を参照してください。

'文本'

'DatetimeType''文本'として指定した场合,インポートされる日付と时尚のデータの型は'texttype'パラメーターで指定された値によって决まります。

  • 'texttype''char'のの合,数据存储は日付を文字ベクトルの细胞配列として返します。

  • 'texttype''细绳'のの合,数据存储は日付を串配列として返します。

例:'DatetimeType', '日期时间'

データ型:char|细绳

テキストファイルからの持续时间データの出力データ型。'DurationType''期间'または'文本'のいずれかで构成されるコンマ区切りのペアとして指定します。

インポートされる时间データの型
'期间'

MATLABの期间データ型

详细については,期间を参照してください。

'文本'

'DurationType''文本'として指定した场合,インポートされる持续时间データの型は'texttype'パラメーターで指定された値によって决まります。

  • 'texttype''char'の结合,インポート关键は持续时间データを文字の细胞配列配列返します。

  • 'texttype''细绳'の场合,インポート关数は长データを串の配列として返します。

データ型:char|细绳|约会时间

変数名を保持するかどうかのフラグ。VariableNamingRuleと,真的または错误的のいずれかで构成されるコンマ区切りのペアとして指定します。

  • '保存'- スペースや非ascii文档をなど,有色なmatlab识别子ではない保持を保持。

  • '调整'- 无效な変数名(关数isvarname.で判定)を,有效なMATLAB识别子に変换。

R2019b以降,変数名と行名には,スペースや非ASCII文字など任意の文字を含めることができます。また,英字だけでなく任意の文字で始めることができます。変数名と行名は,有效なMATLAB识别子(关数isvarname.で判定)である必要はありません。これらの変数名と行名を保持するには,VariableNamingRuleの値を'保存'に设定します。

データ型:char|细绳

これらの名前と値のペアに加えて,次のオブジェクトの任意のプロパティも名前と値のペアとして指定できます。ただし,文件プロパティを除きます。

出力数

すべて折りたたむ

データデータ结合ののデータ。tabulartextdatastore.imageageAtastore.SpreadsheetDatastoreKeyValueDatastorefiledatastore.塔塔塔斯特雷ParquetDatastore,またはDatabaseDatastoreの各オブジェクトのいずれかとして返されます。データストアの种类は,ファイルの种类または引数地点によって决まります。详细については,次の表のデータストア名をクリックしてください。

タイプ 出力
テキストファイル tabulartextdatastore.
イメージファイル imageageAtastore.
スプレッドシートファイル SpreadsheetDatastore
Mapreduce.によって生成されたMATファイルまたはシーケンスファイル KeyValueDatastore
カスタム形式ファイル filedatastore.
高的データ型の关によって生成されたMATファイルまたはシーケンスファイル。 塔塔塔斯特雷
镶木地板 ParquetDatastore
データベース DatabaseDatastore(数据库工具箱)

これらの各データストアのの种类の合书,文件プロパティは文字ベクトルの细胞配列です。个々の文字ベクトルは,地点引数に关连付けられたファイルへの绝対パスです。

R2014Bで导入