主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

spreadsheetDatastore

スプレッドシートファイルのデータストア

説明

スプレッドシートファイルの大規模な集合(必ずしもメモリに収まるとは限らない)を管理するには,SpreadsheetDatastoreオブジェクトを使用します。関数spreadsheetDatastoreをを用してSpreadsheetDatastoreオブジェクトを作成し,そのプロパティを指定すると,オブジェクト関数を使用してデータをインポートできます。

作成

説明

ssd= spreadsheetDatastore (位置は,位置で指定されたデータの集合からスプレッドシートのデータストアを作成します。

ssd= spreadsheetDatastore (位置,名称,值は1つ以上の名前と値のペアの引数を使用して,ssdの追加パラメーターとプロパティを指定します。たとえば,spreadsheetDatastore(位置、“FileExtensions”{“.xlsx”、“xls”})はファイル拡張子に基づいて,データストアに含めるファイルを指定します。

入力引数

开する

データストアに含めるファイルまたはフォルダー。パスまたはDsFileSetオブジェクトとして指定します。

  • パス——ローカルやリモートのファイルまたはフォルダーの場所を含む文字ベクトル,文字ベクトルの细胞配列,字符串スカラー,または字符串配列としてパスを指定します。

    • ローカルのファイルまたはフォルダー——ファイルまたはフォルダーのローカルパスとして位置を指定します。ファイルが现处于のフォルダーに现出,ローカルパスは绝対パスまたは相対をしなければなりませんしのサブフォルダー内あるははははははは,自动でれません。ローカルパスを指定するときワイルドカード文章(*)ををは,一切する内にある,すべてのファイルフォルダーするすべてのをデータストアに含めることををします。

    • リモートのファイルまたはフォルダー-位置HDFS:/// path_to_fileの形式の统一资源定位符(URL)として,ファイルまたはフォルダーの絶対パスに指定します。詳細については,リモートデータの操作を参照してください。

  • DsFileSetオブジェクト-位置DsFileSetオブジェクトオブジェクトとして指定することもできできできについてについて,matlab.io.datastore.DsFileSetを参照してください。

位置FileExtensionsプロパティを参照してください。

関数spreadsheetDatastoreは,xls.xlsx.xlsm..xltx,および.xltmの各拡張子をサポートしています。

例:“file1.xlsx”

例:“. . / dir /数据/ file1.xlsx”

例:{'c:\ dir \ data \ file1.xlsx','c:\ dir \ data \ file2.xlsx'}

例:s3: / / bucketname / path_to_files / * xls”

名前と値のペアの引数

オプションの名称,值の引数ペアをコンマ区切りで指定します。的名字は引数名で,价值は対応する値です。的名字は引用符で囲まなければなりません。name1,value1,...,namen,valuenのように,複数の名前と値のペアの引数を任意の順序で指定できます。

例:ssd = spreadsheetDatastore (C: \ dir \ spreadsheetdata, FileExtensions,{“xls”、“.xlsm”})

スプレッドシートファイルの拡張子。'fileextensions'と,文字ベクトル,文字ベクトルの细胞配列,字符串スカラーまたは字符串配列で構成されるコンマ区切りのペアとして指定します。

  • 'fileextensions'を指定しない場合,spreadsheetDatastoreは,指定パス上のxls.xlsx.xlsm..xltxおよび.xltmの拡張子をもつすべてのファイルを自動的に含めます。

  • 非標準のファイル拡張子をもつスプレッドシートをSpreadsheetDatastoreに含める場合は,それらの拡張子を明示的に指定します。

  • 拡张子をもたないファイルのSpreadsheetDatastoreを作成する場合は,'fileextensions'を空の文字ベクトルとして指定します。

例:'fileextensions',''

例:'fileextensions','。xls'

例:FileExtensions,{‘.xlsx’,‘.xlsm}

データ型:字符|细胞|字符串

サブフォルダーを含めるかどうかフラグフラグ。“IncludeSubfolders”と,真正的0 1のいずれかで構成されるコンマ区切りのペアとして指定します。各フォルダー内のすべてのファイルとサブフォルダーを含めるには真正的を指定し,各各フォルダー内ののファイルを含めるにを指定します。

“IncludeSubfolders”を指定しない場合,既定値はです。

例:'insertumubfolders',真实

データ型:逻辑|

出力のデータ型。“OutputType”00

  • “汽车”- - - - - -'rowtimes'の名前と値のペアを指定するかどうかに基づいて,データストアからの出力を表または时间表のいずれにすべきかを検出します。出力は,'rowtimes'ををする结合は时刻表,指定指定ないない合。

  • '桌子'- - - - - -表格を返します。

  • '时间表'- - - - - -时间表を返します。

OutputTypeの値により,関数预览およびreadallで返されるデータ型が決まります。このオプションを'rowtimes'の名前と値のペアと組み合わせて使用すると,SpreadsheetDatastoreから时间表が返されます。

例:“OutputType”、“时间表”

データ型:字符|字符串

代替ファイルシステムのルートパス。“AlternateFileSystemRoots”と字符串ベクトルまたは细胞配列で構成されるコンマ区切りのペアとして指定します。ローカルマシン上にデータストアを作成するが,別のマシン(異なるオペレーティングシステムの可能性がある)上でデータにアクセスして処理する必要がある場合は,“AlternateFileSystemRoots”また,并行计算工具箱™とMATLAB®并行服务器™を使用してデータを処理し,そのデータがローカルマシンに保存され,そのデータのコピーが異なるプラットフォームのクラウドやクラスターマシンにある場合,“AlternateFileSystemRoots”を使用してルートパスを関連付けなければなりません。

  • 相互に対応する1組のルートパスを関連付けるには,“AlternateFileSystemRoots”を字符串ベクトルとして指定します。

    [" Z: \数据集”、“/ mynetwork /数据集”)

  • データデータストアに対応するする复の组のルートパスを连付けるに,复数行を含む细胞配列配列“AlternateFileSystemRoots”を指定します。各行は対応するルートパスの組を表します。细胞配列内の各行を string ベクトル、または文字ベクトルの cell 配列のいずれかとして指定します。以下に例を示します。

    • “AlternateFileSystemRoots”を字符串ベクトルの细胞配列として指定します。

      {[Z: \“数据集”、“/ mynetwork /数据集”);…[" Y: \数据集”、“/ mynetwork2 /数据集”、“年代:\数据集”)}

    • あるいは,“AlternateFileSystemRoots”を文字ベクトルの细胞配列からなる细胞配列として指定します。

      {{'z:\ datasets','/ mynetwork / datasets'}; ... {'y:\ datasets','/ mynetwork2 / datasets','s:\ datasets'}}

“AlternateFileSystemRoots”の値は,次の条件を満たさなければなりません。

  • 1行以上の行を含み,各行は1組の対応するルートパスを指定する。

  • 各行は複数のルートパスを指定し,各ルートパスは2文字以上を含まなければならない。

  • ルートパスは一意で,他のルートパスのサブフォルダーではない。

  • ファイルの场所を指す1つ以上のルートパスエントリを含む。

詳細については,異なるマシンまたはクラスターで処理するためのデータストアの設定を参照してください。

例:[" Z: \数据集”、“/ mynetwork /数据集”)

データ型:字符串|细胞

テキスト変数の出力データ型。“TextType”'icr'または“字符串”のいずれかで構成されるコンマ区切りのペアとして指定します。

  • 関数readallまたは预览の出力テーブルにテキスト変数が含まれる場合,“TextType”はこれらの変数のデータ型を指定します。

  • “TextType”'icr'の場合,出力は文字ベクトルの细胞配列です。

  • “TextType”“字符串”の结合,出力の型は字符串です。

データ型:字符|字符串

これらの名前と値のペアに加えて,このページの任意のプロパティも名前と値のペアとして指定できます(文件プロパティは除く)。

プロパティ

开する

SpreadsheetDatastore〖datastore〗文件プロパティを除いて,数据存储オブジェクトの作成時に,名前と値のペアの引数を使用してSpreadsheetDatastoreプロパティの値を指定できます。オブジェクトの作成後にプロパティの表示または変更を行うには、ドット表記を使用します。

ds = spreadsheetDatastore (“airlinesmall_subset.xlsx”);ds。张= [1 2];ds。范围=“A1: C6”

ファイルプロパティ

データストアに含まれるファイル。文字ベクトルの细胞配列または字符串配列として解決されます。各文字ベクトルまたは string はファイルへの絶対パスです。関数spreadsheetDatastoreおよび関数数据存储位置引数がこれらのファイルを定義します。

细胞配列で最初に指定するファイルにより,データストア内のすべてのファイルに対する変数名と形式の情報が決定されます。

例:{“C: \ dir \ data \ file1.xls”;“C: \ dir \ data \ file2.xls”}

データ型:细胞|字符串

読み取り時に各シートの先頭からスキップする行数。正の整数として指定します。范围プロパティも指定する場合,NumHeaderLinesは指定されたデータブロックの先頭からスキップする行数です。

データ型:

ファイル内のシート。シート名を含む文字ベクトル、文字ベクトルの细胞配列、字符串スカラーまたは字符串配列、あるいはシートのインデックスの数値ベクトルとして指定します。空の文字ベクトルは,ファイルファイル内のすべてすべてシートを含めることを示し

例:{“sheet1”、“sheet7”}

例:(3 5 7)

データ型:字符|细胞|字符串|

行と列の範囲。シート内の矩形のデータブロックを定義する文字ベクトルまたは字符串スカラーとして指定します。空の文字ベクトルは,范囲范囲がファイルの先头からデータの最后までであるを示し示し示し示し示し

例:“B1: T7”

例:“C:”

データ型:字符|字符串

データストアの最初のファイルの1行目を変数名として読み取るかどうかを示すインジケーター。真正的1)または0)として指定します。

  • 真正的の场合,最初のファイルの最初の非ヘッダー行がそのデータの変数名を决定します。

  • の場合,最初のファイルの最初の非ヘッダー行にそのデータの1行目が含まれます。既定の変数名はVar1Var2などのように割り当てられます。

データ型:逻辑|

変数名を保持するかどうかのフラグ。VariableNamingRuleと,“修改”または“保存”のいずれかで構成されるコンマ区切りのペアとして指定します。

  • “修改”——無効な変数名(関数isvarnameで判定)を有効なMATLAB識別子に変換。

  • “保存”- スペースや非ascii文档をなど,有色なmatlab识别子ではないをを保持。

R2019b以降,変数名と行名には,スペースや非ASCII文字など任意の文字を含めることができます。また,英字だけでなく任意の文字で始めることができます。変数名と行名は,有効なMATLAB識別子(関数isvarnameで判定)である必要はありません。これらの変数名と行名を保持するには,VariableNamingRuleの値を“保存”に設定します。

データ型:字符|字符串

データストア内の変数名。文字ベクトル、文字ベクトルの细胞配列、字符串スカラーまたは字符串配列として指定します。ファイルに表示される順序で変数名を指定します。変数名を指定しない場合は、データ ストアが最初のファイルの最初の非ヘッダー行から検出しれます。文字ベクトルまたは string スカラーを使用してVariableNamesを指定できますが,データストアはプロパティ値を変换して文字ベクトルの细胞配列に保存します。VariableNamesプロパティを変更する場合,新しい変数名の数は,元の変数名の数と一致しなければなりません。

スペースおよび非ASCII文字を含む変数名など,無効なMATLAB識別子を変数名としてサポートするには,VariableNamingRuleパラメーターの値を“保存”に設定します。

ReadVariableNamesのの合,VariableNamesは既定値の{‘Var1’,‘Var2’,…}になります。

例:{“时间”,“日期”,“数量”}

データ型:字符|细胞|字符串

変数の型。各変数のデータ読み取り時の型を示す“双”'icr'“字符串”“分类”または“datetime”として指定します。

変数の型のリストはVariableNames内の変数に対応します。字符およびdatetimeの型はデータから自動的に検出されます。VariableTypesを文字ベクトルまたは字符串スカラーとして指定できますが,spreadsheetDatastoreは自動的に文字ベクトルの细胞配列または字符串配列に変換します。

例:{“字符”,“分类”}

データ型:字符|细胞|字符串

预览readallテーブルのプロパティ

ファイルから読み取る変数。文字ベクトル、文字ベクトルの细胞配列、字符串スカラーまたは字符串配列として指定します。各文字ベクトルまたは字符串には1つの変数の名前を含めます。変数名は任意の順序で指定できます。SelectedVariableNamesを文字ベクトルまたは字符串スカラーとして指定できますが,spreadsheetDatastoreは自動的に文字ベクトルの细胞配列または字符串配列に変換します。

スペースおよび非ASCII文字を含む変数名など,無効なMATLAB識別子を変数名としてサポートするには,VariableNamingRuleパラメーターの値を“保存”に設定します。

例:{‘Var3’,‘Var7’,‘Var4}

データ型:字符|细胞|字符串

選択した変数の型。選択した各変数のデータ読み取り時の型を示す“双”'icr'“字符串”“分类”または“datetime”として指定します。変数の型のリストはSelectedVariableNames内の変数に対応します。字符およびdatetimeの型はデータから自動的に検出されます。SelectedVariableTypesを文字ベクトルまたは字符串スカラーとして指定できますが,自動的に文字ベクトルの细胞配列または字符串配列に変換されます。

例:{“双”,“datetime”}

データ型:字符|细胞|字符串

関数の一度の呼び出しで読み取るデータの量。“文件”または“表”,あるいは正の整数スカラーとして指定します。

  • ReadSize“文件”のの合,の各呼び出しで一度に1ファイルのすべてのデータを読み取ります。

  • ReadSize“表”のの合,の各呼び出しで一度に1シートのすべてのデータを読み取ります。

  • ReadSizeが正の数の合并,の各呼び出しはReadSizeで指定される行数(あるいはそれ未満の行数でデータの最後に到達するまで)を読み取ります。

ReadSizeをを数スカラーから“文件”または“表”に変更した場合,あるいはその逆を行った場合,データストアは関数重置を使用してリセットされます。

データ型:字符|字符串|

行時間変数の名前。'rowtimes'および数名(“日期”など)または変数インデックス(3.など)で構成されるコンマ区切りのペアとして指定します。

RowTimesは时间表に関連するパラメーターです。时间表の各行は、timetable の時間ベクトルに記録されている時間に関連付けられます。RowTimes内内に指定さされる変は,datetimeベクトルまたは持续时间ベクトルを含まなければなりません。

“OutputType”の値が'时间表'だが'rowtimes'を指定しない場合,SpreadsheetDatastoreは,最初のdatetime変数または持续时间変数を时间表の行時間として使用します。

writeallでで用するプロパティ

このプロパティは読み取り専用です。

データストアの作成に使用するフォルダー。文字ベクトルの细胞配列として返されます。cell 配列は列ベクトルとして方向付けされます。各文字ベクトルは、データ ファイルを含むフォルダーへのパスです。関数spreadsheetDatastoreおよび関数数据存储位置引数は,データストアの作成時に文件夹を定義します。

SpreadsheetDatastoreオブジェクトの文件プロパティを変更すると,文件夹プロパティがリセットされます。

データ型:细胞

このプロパティは読み取り専用です。

書き込みでサポートされる形式のリスト。字符串の行として返されます。このプロパティは、writeallを使用してデータストアから出力ファイルを書き込む際に使用可能な出力形式を指定します。

データ型:字符串

このプロパティは読み取り専用です。

既定の出力形式。字符串スカラーとして返されます。このプロパティは、writeallを使用してデータストアから出力ファイルを書き込む際の既定の形式を指定します。

データ型:字符串

オブジェクト関数

hasdata データが読み取り可能かどうかを判別
numpartitions データストアの区画数
分区 データストアを分割する
预览 データストア内のデータのサブセットをプレビュー
データストアのデータの読み取り
readall データストアのすべてのデータの読み取り
writeall ファイルへのデータストアの書き込み
重置 データストアの初期状態へのリセット
sheetnames データストアからシート名をクエリする
变换 データストアの変換
结合 複数のデータストアのデータを統合
isPartitionable データストアが分割可能かどうかを判別
isShuffleable データストアがシャッフル可能かどうかを判別

すべて折りたたむ

ssd = spreadsheetDatastore (“airlinesmall_subset.xlsx”
SSDS =带有属性的SpepsheetDataStore:文件:{'... \ Documents \ Matlab \ examples \ Matlab-ex26030327 \ Airlinesmall_subset.xlsx'}文件夹:{'... \ Onedrive  -  Mathworks \ Documents \ Matlab \ examples \ Matlab-ex26030327'} lexeryfilesystemroots:{}表:''范围:''表格格式属性:numheaderlines:0 variablenamingrule:'修改'readvariablenames:true variablenames:{'年','月','dayofmonth'和26}variabletypes:{'double','double','double'...和26更多}控制通过预览,read,readall:selectedvariablenames:{'年','月份','dayofmonth'...} SelectedVariableTypes: {'double', 'double', 'double'…ReadSize: 'file' OutputType: 'table' RowTimes: [] Write-specific Properties: SupportedOutp金宝apputFormats: ["txt" "csv" "xlsx" "xls" "parquet" "parq"] DefaultOutputFormat: "xlsx"

ファイルairlinesmall_subset.xlsxを含むSpreadsheetDatastoreオブジェクトを作用成し。

ssd = spreadsheetDatastore (“airlinesmall_subset.xlsx”
ssd与属性= SpreadsheetDatastore:文件 : { ' .../ Bdoc21a_1664464_180108 / tp48b88cd2 ex29672123 / airlinesmall_subset.xlsx '}文件夹:{“/ tmp / Bdoc21a_1664464_180108 / tp48b88cd2 / ex29672123”}AlternateFileSystemRoots:{}表:“范围:”表的格式属性:NumHeaderLines: 0 VariableNamingRule:“修改”ReadVariableNames:true VariableNames: {'Year', 'Month', 'DayofMonth'…{'double', 'double', 'double'…控制由preview, read, readall返回的表的属性:SelectedVariableNames: {'Year', 'Month', 'DayofMonth'…} SelectedVariableTypes: {'double', 'double', 'double'…ReadSize: 'file' OutputType: 'table' RowTimes: [] Write-specific Properties: SupportedOutp金宝apputFormats: ["txt" "csv" "xlsx" "xls" "parquet" "parq"] DefaultOutputFormat: "xlsx"

ファイルにはをますし。

sheetnames (ssd, 1)
Ans = 13x1 string array "1996" "1997" "1998" "1999" "2000" "2001" "2002" "2003" "2004" "2005" "2006" "2007" "2008"

关心のあるデータとして2番目のシートシート数FlightNumを指定し,最初の8行をプレビューします。

ssds.sheets = 2;ssds.selectedvariablenames =.“FlightNum”;预览(ssd)
ans = 8x1 table FlightNum _________ 1014 1201 702 1184 1310 1759 1242 1558

最初のシートで,変数DepTimeと変数arttime.の最初の3行のみを読み取ります。

ssd。ReadSize = 3;ssd。表= 1;ssds.selectedvariablenames =.{“DepTime”,“ArrTime”};阅读(ssd)
ans = 3x2 table DepTime ArrTime _______ _______ 2117 2305 1252 1511 1441 1708

4、5、6番目のシートからすべてを読み取ります。

ssd。表= 4:6;readall (ssd);

OutputTypeおよびRowTimesの名前と値のペアを使用して,SpreadsheetDatastoreから表ではなく时间表が返されるようにします。

tsunamis_dated.xlsxのデータストアを作成します。“OutputType”'时间表'として指定して,SpreadsheetDatastoreから表ではなく时间表が返されるようにします。

ssd = spreadsheetDatastore (“tsunamis_dated.xlsx”,“OutputType”,'时间表');预览(ssd)
ans =8×15时间表日期经度纬度ValidityCode有效性CauseCode引起EarthquakeMagnitude国家位置MaxHeight IidaMagnitude强度NumDeaths DescDeaths时间  ___________ ________ _________ ____________ ____________________ _________ ____________________________ ___________________ _____________ ____________________________ _________ ______________________ _________ __________ ________________________ 04 - mar - 1952 42.15 - 143.85 4{“明确的海啸”}1 8.1{‘地震’}{‘日本’}{SE。4{'明确的海啸'}3{'地震和滑坡'}3{'美国'}'SE阿拉斯加,AK} 524.26 4.6 - 5 5 1958 06:15:53.600 10 - 7月22日- 1960年5月- -39.5 - -74.5 4{“明确的海啸”}1 9.5{‘地震’}{“智利”}{智利中部的}25 4.6 - 4 1260 3 22日- 1960年5月- 1960年11月19:11:17.000 20 - - -6.8 - -80.7 4{“明确的海啸”}1 6.8{‘地震’}{秘鲁的}{秘鲁的}9 3.2 - 2.5 66 2 - 1960 22:01:56.400 11月20 - 28 - mar - 1964 61.1 -147.5 - 4{'确定海啸'}1{'地震'}7.5{'日本'}{'美国'}{'威廉王子海湾,AK'} 67 6.1 221 3 28-Mar-1964 03:36:14 000 16- june -1964 38.65 139.2 4{'确定海啸'}1{'地震'}7.5{'日本'}{'西北。本州岛}5.8 2.7 - 2 1 16 - 26日1968年6月- 1964 04:01:44.300 14 - 8月- 0.2 - 119.8 4{“明确的海啸”}1 7.8{‘地震’}{“印度尼西亚”}{“班达海”}10 3.3 3 200 1968 22:14:19.400 14 - 8月23日- 1969年2月- -3.1 - 118.9 4{“明确的海啸”}1 6.9{‘地震’}{“印度尼西亚”}{“望加锡海峡”}4 2 2 600 1969 00:36:56.600 23 - 2月

'rowtimes'を指定しない場合,spreadsheetDatastoreは,最初のdatetime変数または时间変数を行時間として使用します。この場合は,変数日期が行時間に使用されます。このデータには日期时间の2つのdatetime変数があります。変数日期には時,分または秒に関する情報が含まれず,変数时间には各イベントの特定の時刻が含まれます。

'rowtimes'オプションを指定して,イベント時間(変数时间)を行時間として使用します。

ssd = spreadsheetDatastore (“tsunamis_dated.xlsx”,“OutputType”,'时间表','rowtimes',“时间”);预览(ssd)
ans =8×15时间表的时间经度纬度ValidityCode有效性CauseCode引起EarthquakeMagnitude国家位置MaxHeight IidaMagnitude强度NumDeaths DescDeaths日期  ________________________ ________ _________ ____________ ____________________ _________ ____________________________ ___________________ _____________ ____________________________ ______________________ _________ _________ __________ ___________ 04 - mar - 1952 01:22:41.000 42.15 - 143.85 4{“明确的海啸”}1 8.1{‘地震’}{‘日本’}{SE。4{'明确的海啸'}3{'地震和滑坡'}3{'美国'}'SE阿拉斯加,正义与发展党’}524.26 - 4.6 5 5 1 10——1958年7月22日——1960年5月——19:11:17.000 -39.5 - -74.5 4{“明确的海啸”}1 9.5{‘地震’}{“智利”}{智利中部的}25 4.6 - 4 1260 3 1960年- 1960年5月- 11月20 - 22日22:01:56.400 -6.8 - -80.7 4{“明确的海啸”}1 6.8{‘地震’}{秘鲁的}{秘鲁的}9 3.2 2.5 66 2 20 - 1964年11月- 1960年3月28 - - 03:36:14.000 61.1 -147.5 - 4{'明确的海啸'}1{'地震'}7.5{'日本'}{'日本'}'西北'}67 6.1 221 3 1964年3月28日-1964年6月16日04:01:44.300 38.65 139.2 4{'明确的海啸'}1{'地震'}7.5{'日本'}'西北本州岛”}5.8 - 2.7 2 26 1 16 - 1968年6月- 1964年8月14 - - 22:14:19.400 0.2 - 119.8 4{“明确的海啸”}1 7.8{‘地震’}{“印度尼西亚”}{“班达海”}200 3 14 - 3.3 - 3 1969年8月- 1968年2月23 - - 00:36:56.600 -3.1 - 118.9 4{“明确的海啸”}1 6.9{‘地震’}{“印度尼西亚”}{“望加锡海峡”}4 2 2 600 3 1969年- 2月23日
R2016aで導入