主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

チェックポイント作成のため高配列をローカルな場所およびリモートの場所に書き込む

説明

写(位置助教は,高配列助教の値を計算して,位置によって指定されたフォルダー内のファイルにこの配列を書き込みます。データは,数据存储(位置)を使用して読み取るために適した効率的なバイナリ形式で保存されます。

写(filepattern助教filepatternからのファイル拡張子を使用して,出力形式を決定します。filepatternには,ファイルを書き込むフォルダーが含まれ,ワイルドカードを含むファイル名がそれに続かなければなりません。このワイルドカードは,一意のファイル名を生成するための,インクリメントする数値を表します。たとえば,写(文件夹/ myfile_ * . csv, tA)のようになります。

写(___名称,值は,前述の任意の構文を使用して,1つ以上の名前と値のペアの引数による追加オプションを指定します。たとえば,“文件类型”と有効なファイルタイプ(“垫”“>”“铺”“文本”,または“表格”)を使ってファイルタイプを指定することができ,あるいは“WriteFcn”と関数ハンドルを使って,データを処理するためのカスタム書き込み関数を指定することができます。

すべて折りたたむ

高配列をディスクに書き込み,その後,書き込んだファイルの新しいデータストアを作成することで高配列を復元します。このプロセスは,作業内容を保存したり,高配列を同僚と共有したりするために役立ちます。

airlinesmall.csvデータセットのデータストアを作成します。変数一年およびUniqueCarrierのみを選択し,“NA”値を欠損データとして扱います。データストアを高表に変換します。

ds =数据存储(“airlinesmall.csv”);ds。TreatAsMissing =“NA”;ds。SelectedVariableNames = {“月”“年”“UniqueCarrier”};tt =高(ds)
tt = M×3 tall table Month Year UniqueCarrier _________ _____________ 10 1987 'PS' 10 1987 'PS' 10 1987 'PS' 10 1987 'PS' 10 1987 'PS' 10 1987 'PS' 10 1987 'PS' 10 1987 'PS' 10 1987 'PS' 10 1987 'PS' 10 1987 'PS' 10 1987 'PS'::::::

データを年によって降順に並べ替え,上25位行を抽出します。結果の高表は評価されません。

tt_new = topkrows (tt, 25岁,“年”
tt_new = M×3月年UniqueCarrier高表  _____ ____ _____________ ?????????::::::预览延期。 Learn more.

結果をC: \ディスクのExampleDataという名前の新規フォルダーに保存します(特にWindows®コンピューターを使用していない場合は,異なる書き込み先を指定することが可能)。関数は,ファイルを書き込む前に高配列を評価するため,データを保存する前に関数收集を使用する必要はありません。

位置=“C: \ ExampleData”;写(位置,tt_new)
using the Local MATLAB Session: - Pass 1 of 1: Completed in 0.52 sec

作業ディレクトリからttdsをクリアします。ディスクに書き込まれた高表を復元するには,最初に,同じディレクトリを参照する新しいデータストアを作成します。その後,データストアを高表に変換します。高table は、ディスクに書き込まれる前に評価されたため、今回の表示には、値のプレビューが含まれます。

清晰的ttdsds2 =数据存储(位置);tt2 =高(ds2)
tt2 = M×3 tall table Month Year UniqueCarrier _________ _____________ 1 2008 'WN' 1 2008 'WN' 1 2008 'WN' 1 2008 'WN' 1 2008 'WN' 1 2008 'WN' 1 2008 'WN'::::::

データファイルtsunamis.xlsxを参照する高表を作成します。このデータファイルには,場所,大きさ,津波の原因についてのタイムスタンプ付きデータが含まれています。

ds = spreadsheetDatastore (“tsunamis.xlsx”);T =高(ds)
T = Mx20高表经度纬度年月日小时分钟第二ValidityCode有效性CauseCode引起EarthquakeMagnitude国家位置MaxHeight IidaMagnitude强度NumDeaths DescDeaths  ________ _________ ____ _____ ___ ____ ______ ______ ____________ _________________________ _________ __________________ ______________________________________ __________________________ _________ _____________ _________ _________ __________ - 3.8 - 128.3 1950 10 8 3 23南2{“可疑的海啸”}1 7.6{‘地震’}{“印度尼西亚”}{“JAVA海沟,印尼的}-156 1951 19.5 2.8 1.5 1.5南南8 21 10 57南4{“明确的海啸”}1 6.9{‘地震’}{‘美国’}{“夏威夷”}3.6 - 1.8南南南-9.02 - 157.95 1951 12 22南南南2{“可疑的海啸”}6{“火山”}南{所罗门群岛的}{‘KAVACHI} 6 2.6南南南42.15 - 143.85 1952 3 4 1 22 41 4{“明确的海啸”}1{'Earthquake'} 8.1 {'JAPAN'} {'SE。北海道岛}6.5 19.1 2.7 - 2 33 -155 1952 3 17 58南4{“明确的海啸”}1 4.5{‘地震’}{‘美国’}{“夏威夷”}1南南南南43.1 - -82.4 1952 5 6南南南1{“非常怀疑海啸”}9{“气象”}南{‘美国’}{“休伦湖,MI} 1.52南南南南52.75 - 159.5 1952 11 4 16 58南4{“明确的海啸”}1{‘地震’}9{“俄罗斯”}{堪察加半岛的}18 4.2 - 4 2236 3 1953 156.5 3 18南南南3{“可能的海啸”}1 5.8{‘地震’}{“俄罗斯”}{' N。千岛群岛的}1.5 - 0.6南南南  : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : :

一年一天小时一分钟,および第二个の各変数を単一のdatetime変数に結合し,それらの変数を表から削除します。欠損データを含む行があれば,削除します。

T.DateTime = datetime (T。一年,T.月,T.一天,T.小时, T.Minute, T.Second); T(:,3:8) = []; TT = rmmissing(T)
TT = Mx15高表经度纬度ValidityCode有效性CauseCode引起EarthquakeMagnitude国家位置MaxHeight IidaMagnitude强度NumDeaths DescDeaths DateTime  ________ _________ ____________ ____________________ _________ ____________________________ ___________________ _____________ ____________________________ ______________________ _________ _________ __________ ____________________ 42.15 - 143.85 4{“明确的海啸”}1 8.1{‘地震’}{‘日本’}{SE。4{'确定海啸'}3{'地震和滑坡'}3{'美国'}'SE. '日本' . '日本' . '日本' . '日本' . '日本' . '日本' . '日本' . '日本' . '日本' . '日本' . '阿拉斯加,正义与发展党’}524.26 - 4.6 5 5 1 10 - 7月- 1958年06:15:53 -39.5 - -74.5 4{“明确的海啸”}1 9.5{‘地震’}{“智利”}{智利中部的}3 22 - 25 4.6 - 4 1260 5 - 1960 19:11:17 -6.8 - -80.7 4{“明确的海啸”}1 6.8{‘地震’}{秘鲁的}{秘鲁的}9 3.2 - 2.5 66 2 - 1960 22:01:56 11月20 - 61.1 - -147.5 4{“明确的海啸”}3 9.2{地震和山体滑坡的}{'USA'} {'PRINCE WILLIAM SOUND, AK'} 67 6.1 5 221 3 28-Mar-1964 03:36:14 38.65 139.2 4 {'definite tsunami'} 1 {'Earthquake'} 7.5 {'JAPAN'} {'NW. 5 .(日本)本州岛}5.8 2.7 - 2 1 16 - 6月26日- 1964年04:01:44 0.2 - 119.8 4{“明确的海啸”}1 7.8{‘地震’}{“印度尼西亚”}{“班达海”}10 3.3 200 3 14 - 8月- 1968 22:14:19 -3.1 - 118.9 4{“明确的海啸”}1 6.9{‘地震’}{“印度尼西亚”}{“望加锡海峡”}4 2 2 600 1969 00:36:56 23 - 2月  : : : : : : : : : : : : : : : : : : : : : : : : : :: : : :

表をスプレッドシートファイルとしてAmazon S3®ストレージのリモートの場所に書き込みます。Amazon S3でデータの読み取りや書き込みを行うには,自分のアカウントの資格情報を使用して,環境変数AWS_ACCESS_KEY_IDおよびAWS_SECRET_ACCESS_KEYを設定しなければなりません。詳細については,リモートデータの操作を参照してください。

setenv (“AWS_ACCESS_KEY_ID”“YOUR_AWS_ACCESS_KEY_ID”);setenv (“AWS_SECRET_ACCESS_KEY”“YOUR_AWS_SECRET_ACCESS_KEY”);位置=“s3: / / bucketname / preprocessedData /”;写(位置、TT“文件类型”“表格”

データを読み戻すには,数据存储を使用して,現在データが存在するリモートの場所をポイントします。

ds =数据存储(位置);tt =高(ds);

カスタム書き込み関数を作成し,これを使用して,では直接サポートされていない(イメージファイルなどの)追加の形式でデータを書き込みます。

工具箱/ matlab /演示フォルダー内のサンプルイメージをすべて参照するイメージデータストアを作成します。選択したイメージには,拡張子jpg.tif,および. pngが付いています。データストアを高细胞配列に変換します。

demoFolder = fullfile (matlabroot,“工具箱”matlab的“演示”);ds = imageDatastore (demoFolder,“FileExtensions”, {“jpg”“.tif”“使用”});T =高(ds);

イメージの1つをメモリに入れ,表示します。

我=聚集(T (1));
using the Local MATLAB Session: - Pass 1 of 1: Completed in 3 sec
imshow(我{1},“InitialMagnification”, 30)

はイメージファイルを直接にはサポートしないため,イメージを別の形式で書き出すには,ファイルの書き込みを処理する新しい関数を作成しなければなりません。書き込み関数は,写:から2つの入力を受け取ります。

  • 信息は,現在のデータブロックに関する情報をもつフィールドを含む構造体。これらのフィールドを使用して独自の固有なファイル名を構成するか,または単にSuggestedFilenameフィールドを使っての推奨する名前を使用することができます。

  • 数据は現在のデータブロック。データストアでを使用することによって取得されます。

関数图像打印机の推奨するファイル名を使用し,imwriteを使ってイメージファイルをjpgファイルとしてディスクに書き込みます。この関数を現在の作業フォルダーに保存します。

类型图像打印机
function imageWriter(info, data) filename = info. suggestedfilename;imwrite(数据{:},文件名)

データストアにあるイメージを,C: \ディスク上のexampleImagesという名前の新規フォルダーに書き込みます(特にWindows®コンピューターを使用していない場合は,別の場所を使用することが可能)。名前と値のペアの引数“WriteFcn”を使用して,图像打印机をカスタム書き込み関数として渡します。

位置=“C: \ exampleImages \ * . jpg image_”;写(位置、T“WriteFcn”@imageWriter)
using the Local MATLAB Session: - Pass 1 of 1: Completed in 0.71 sec评估完成在0.98秒

ファイルの書き込まれたフォルダーの内容を表示します。

dirC: \ exampleImages
.Image_1_000001.jpg image_3_000001.jpgimage_2_000001.jpg image_4_000001.jpg image_6_000001.jpg

イメージをMATLAB®に読み戻すには,同じ場所を参照するデータストアを作成します。

ds = imageDatastore(位置);T =高(ds)
T = 6×1 tall cell array {1024×2048×3 uint8} {650×600×3 uint8} {1024×2048×3 uint8} {650×600×3 uint8} {480×640×3 uint8} {480×640×3 uint8}

入力引数

すべて折りたたむ

データを書き込むためのフォルダーの場所。文字ベクトルまたは字符串として指定します。位置には,絶対パスまたは相対パスを指定できます。指定されたフォルダーは,次のオプションのいずれかになります。

  • 既存の空のフォルダー

  • が作成する新規フォルダー

データは,コンピューター上のローカルフォルダー,共有ネットワーク上のフォルダー,あるいはHDFS™,Azure®またはAmazon S3™におけるリモートの場所に書き込むことができます。リモートの場所でのデータの読み取りと書き込みの詳細については,リモートデータの操作を参照してください。

Hadoop®およびApache火花™には,その他の考慮事項が適用されます。

  • ローカルで使用できないフォルダーについては,次の形式のURL(统一资源定位器)を使用してフォルダーへの絶対パスを指定しなければなりません。
    hdfs: / / /path_to_file

  • HDFSに書き込む場合は,HADOOP_HOMEHADOOP_PREFIXMATLAB_HADOOP_INSTALLのいずれかの環境変数を,Hadoopがインストールされているフォルダーに設定します。

  • Apache火花に書き込む場合は,SPARK_HOME環境変数を,Apache火花がインストールされているフォルダーに設定します。

例:位置= ' hdfs: / / /一些/输出/文件夹”は,HDFSのURLを指定します。

例:位置 = '../../ dir /数据的は,相対ファイルパスを指定します。

例:位置= ' C: \ \用户桌面的名字\ \数据”は、窗户®デスクトップフォルダーへの絶対パスを指定します。

例:位置= '文件:/ / /道路/ /数据的は,フォルダーへの絶対URIのパスを指定します。

データ型:字符|字符串

入力配列。高配列として指定します。

ファイル命名パターン。字符串または文字ベクトルとして指定します。ファイル命名パターンには、ファイルを書き込むフォルダーが含まれ、ワイルドカードを含むファイル名がそれに続かなければなりません。関数はワイルドカードを連続番号に置き換え,ファイル名が必ず一意となるようにします。

例:写(“文件夹/ data_ * . txt”,tA)は,data_1.txtdata_2.txtなどのファイル名をもつ一連の. txtファイルとして,高配列助教文件夹に書き込みます。

データ型:字符|字符串

名前と値のペアの引数

オプションの名称,值の引数ペアをコンマ区切りで指定します。的名字は引数名で,价值は対応する値です。的名字は引用符で囲まなければなりません。Name1, Value1,…,的家のように,複数の名前と値のペアの引数を任意の順序で指定できます。

例:写入('C:\myData', tX, 'FileType', 'text', 'WriteVariableNames', false)は,高配列tXを,列見出しとして変数名を使用しないテキストファイルのコレクションとしてC: \ myDataに書き込みます。
一般オプション

すべて折りたたむ

ファイルの種類。“文件类型”と,許可されたファイルタイプ(“汽车”“垫”“铺”“>”“文本”,または“表格”)のいずれかで構成されるコンマ区切りのペアとして指定します。

“文件类型”の名前と値のペアを位置引数と共に使用して,どのような種類のファイルを書き込むかを指定します。既定では,は適切なファイルタイプを自動検出するよう試みます。位置またはfilepattern引数の拡張子からファイルタイプを判定できる場合,名前と値のペアの引数“文件类型”を指定する必要はありません。は,次の拡張子からファイルタイプを判定できます。

  • MATLAB®データファイルの場合,.mat

  • 镶木地板ファイルの.parquetまたは.parq

  • シーケンスファイルの場合,.seq

  • 区切りテキストファイルの場合,. txt.datまたは. csv

  • スプレッドシートファイルの場合,xls.xlsx.xlsb.xlsm.xltx,または.xltm

例:写入('C:\myData', tX, 'FileType', 'text')

カスタム書き込み関数。“WriteFcn”と関数ハンドルで構成されるコンマ区切りのペアとして指定します。指定した関数は助教からデータのブロックを受け取り,出力ファイルの作成を受け持ちます。が出力形式を直接にサポートしていない場合でも,名前と値のペアの引数“WriteFcn”を使用して,さまざまな形式でデータを書き込むことができます。

関数シグネチャ

カスタム書き込み関数は,信息数据の2つの入力引数を受け入れなければなりません。

函数myWriter(信息,数据)

  • 数据には,助教からのデータのブロックが含まれている。

  • 信息は,データのブロックに関する情報を含むフィールドをもつ構造体。これらのフィールドを使用して,最終的な場所でグローバルに一意となる,新しいファイル名を構成することができます。構造体フィールドは次のとおりです。

    フィールド 説明
    RequiredLocation 一時出力フォルダーへの完全修飾パス。このフォルダーに書き込まれたファイルのみが,最終の書き込み先にコピーされます。
    RequiredFilePattern 出力ファイル名に必要なファイルパターン。フォルダー名のみが指定されている場合,このフィールドは空になります。
    SuggestedFilename 場所と命名の要件を満たす,完全修飾の,グローバルに一意なファイル名。
    PartitionIndex 書き込まれる高配列の区画のインデックス。
    NumPartitions 高配列における区画の総数。
    BlockIndexInPartition 区画内での現在のデータブロックの位置。
    IsFinalBlock 現在のブロックが区画の最終ブロックである場合は真正的

ファイルの命名

出力ファイルに使用されるファイル名によって,後ほど数据存储がファイルを読み戻す順序が決定されます。ファイルの順序が重要である場合は,SuggestedFilenameフィールドを使用してファイルに命名することをお勧めします。推奨される名前によってファイルの順序が確定されるからです。推奨されるファイル名を使用しない場合,カスタム書き込み関数はグローバルに一意な,正しく順序付けられたファイル名を作成しなければなりません。ファイル名は,RequiredFilePatternで概説されている命名パターンに従う必要があります。并行计算工具箱™での並列実行に際しては,各ワーカーが独自のローカルフォルダーに書き込む場合でも,ファイル名はワーカー間で一意であり,かつ正しく順序付けられていなければなりません。

複数の区画をもつ配列

高配列を区画に分けて,配列に対する并行计算工具箱での並列計算を実行しやすくすることができます。それぞれの区画はさらに,個々がメモリに収まる,より小さなブロックで構成されています。

信息には,PartitionIndexNumPartitionsBlockIndexInPartitionIsFinalBlockなど,区画に関連するいくつかのフィールドが含まれています。これらのフィールドは,単一のファイルを書き込み,そこに追加していく場合に便利です。これは,多くのブロックに分割された大きな区画をもつ配列では,一般的に行われるタスクです。カスタム書き込み関数はブロックごとに 1 回呼び出され、1 つの区画内のブロックは常に、同じワーカーによって順番に書き込まれます。ただし、別々の区画は別々のワーカーによって書き込まれる可能性があります。

関数の例

スプレッドシートファイルを書き込む単純な書き込み関数は,次のとおりです。

函数dataWriter(info, data) filename = info. suggestedfilename;writetable(数据、文件名“文件类型”“表格”结束
dataWriterを何らかのデータtt用の書き込み関数として呼び出すには,以下のコマンドを使用します。
tt =高(array2table (rand (5000 3)));位置=“/ tmp / MyData / tt_ * .xlsx”;写(位置、tt“WriteFcn”, @dataWriter);
それぞれのブロックで,関数dataWriter信息構造体の推奨ファイル名を使用し,スプレッドシートファイルを書き込むためにwritetableを呼び出します。推奨ファイル名では,位置引数で指定されているファイル命名パターンが考慮されます。

データ型:function_handle

テキストファイルまたはスプレッドシートファイル

すべて折りたたむ

変数名を列見出しとして書き込むためのインジケーター。“WriteVariableNames”と,数値もしくは逻辑の1真正的)または0)で構成されるコンマ区切りのペアとして指定します。

インジケーター

動作

真正的

変数名を出力の列見出しとして含める(既定)。

変数名を出力に含めない。

日付を書き込むためのロケール。“DateLocale”と,文字ベクトルまたは字符串スカラーで構成されるコンマ区切りのペアとして指定します。datetime値をファイルに書き込む場合,DateLocaleを使用してが月と曜日の名前と省略形を書き込むためのロケールを指定します。xx_YYの形式の文字ベクトルまたは字符串。xxはISO 639 - 1で定義された小文字2文字の言語コードで,YYはISO 3166 - 1α2で定義された大文字の国コードです。ロケールの一般的な値の一覧については,関数datetime语言环境の名前と値のペア引数を参照してください。

Excel®ファイルの場合,datetime配列を含む変数をExcelの日付として書き込み,“DateLocale”パラメーターの値は無視します。datetime1900年の変数にまたは1904年よりも前の年が含まれている場合,はその変数をテキストとして書き込みます。Excelの日付の詳細については,Excel中1900年和1904年日期系统的差异を参照してください。

例:“DateLocale”、“ja_JP”または“DateLocale”、“ja_JP”

データ型:字符|字符串

テキストファイルのみ

すべて折りたたむ

フィールドの区切り記号。“分隔符”と次の指定子のいずれかで構成されるコンマ区切りのペアとして指定します。

指定子

フィールドの区切り記号

”、“

“逗号”

コンマ(既定)

' '

“空间”

スペース

' \ t '

“标签”

タブ

';'

“半”

セミコロン

“|”

“酒吧”

縦棒

名前と値のペアの引数“分隔符”は,区切り付きテキストファイルに対してのみ使用できます。

例:“分隔符”、“空间”または“分隔符”,“空间”

引用符付きテキスト書き込みのインジケーター。“QuoteStrings”と,または真正的のいずれかで構成されるコンマ区切りのペアとして指定します。“QuoteStrings”真正的に設定されている場合,はテキストを二重引用符で囲み,テキストの一部として表示される二重引用符をすべて2つの二重引用符に置き換えます。例については,引用符付きテキストのCSVファイルへの書き込みを参照してください。

名前と値のペアの引数“QuoteStrings”は,区切り付きテキストファイルでのみ使用できます。

ファイルに関連付けられた文字エンコードスキーム。“编码”“系统”で構成されるコンマ区切りのペア,または次の表に示す値のいずれかのような標準の文字エンコードスキーム名として指定します。エンコードを指定しない場合,またはエンコードを“系统”として指定した場合,関数はシステムの既定のエンコードを使用してファイルを書き込みます。

“繁体”

“iso - 8859 - 1”

“windows - 874”

“Big5-HKSCS”

“iso - 8859 - 2”

“windows - 949”

“CP949”

“iso - 8859 - 3”

“windows - 1250”

“EUC-KR”

“iso - 8859 - 4”

“windows - 1251”

“EUC-JP”

“iso - 8859 - 5”

“windows - 1252”

“EUC-TW”

“iso - 8859 - 6”

“windows - 1253”

“GB18030”

“iso - 8859 - 7”

“windows - 1254”

“GB2312”

“iso - 8859 - 8”

“windows - 1255”

“GBK”

“iso - 8859 - 9”

“windows - 1256”

“IBM866”

“iso - 8859 - 11”

“windows - 1257”

“KOI8-R”

“iso - 8859 - 13”

“windows - 1258”

“KOI8-U”

“iso - 8859 - 15”

“us - ascii”

“麦金塔”

“utf - 8”

“Shift_JIS”

例:“编码”、“系统”または“编码”,“系统”ではシステムの既定のエンコードを使用します。

スプレッドシートファイルのみ

すべて折りたたむ

ターゲットのワークシート。“表”と,ワークシート名またはワークシートインデックスを示す正の整数を含む文字ベクトルまたは字符串スカラーで構成されるコンマ区切りのペアとして指定します。ワークシート名にコロン(:)を含めることはできません。スプレッドシートファイルのシートの名前を調べるには,表= sheetnames(文件名)を使用します。詳細については,sheetnamesを参照してください。

シートが存在しない場合は,がワークシートコレクションの最後に新しいシートを追加します。シートのインデックスがワークシート数より大きい場合は,ワークブック内のワークシートの数がシートインデックスと同じになるまで,は空のシートを追加します。いずれの場合でも,は新しいワークシートが追加されたことを示す警告を表示します。

名前と値のペアの引数“表”は,スプレッドシートファイルでのみ使用できます。

例:“表”2

例:“表”“MySheetName”

データ型:字符|字符串|||int8|int16|int32|int64|uint8|uint16|uint32|uint64

镶木地板ファイルのみ

すべて折りたたむ

镶木地板の圧縮アルゴリズム。次の値のいずれかとして指定します。

  • “时髦的”“brotli”“gzip”,または未压缩的。1つの圧縮アルゴリズムを指定すると、は同じアルゴリズムを使用してすべての変数を圧縮します。

  • または,各変数に使用する圧縮アルゴリズムの名前が含まれる文字ベクトルの细胞配列または字符串ベクトルを指定できます。

一般に,“时髦的”の読み取りと書き込みのパフォーマンスは高く,“gzip”はCPU処理時間が長くなりますが圧縮率が高く,“brotli”は通常,圧縮速度が低下しますが最小ファイルサイズを作成します。

例:写入('C:\myData', tX, 'FileType', 'parquet', 'VariableCompression', 'brotli')

例:写入('C:\myData', tX, 'FileType', 'parquet', 'VariableCompression', {'brotli' ' 'snappy' ' 'gzip'})

エンコードスキーム名。次の値のいずれかとして指定します。

  • “汽车”- - - - - -は逻辑変数に対しては“普通”エンコードを使用し,その他すべてに対しては“字典”エンコードを使用します。

  • “字典”“普通”——あるエンコードスキームを指定した場合,はそのスキームを使用してすべての変数をエンコードします。

  • または,各変数に使用するエンコードスキームの名前が含まれる文字ベクトルの细胞配列または字符串ベクトルを指定できます。

一般に,“字典”エンコードによってファイルサイズが小さくなりますが,繰り返しの値が多く含まれていない変数については“普通”エンコードの方がより高速になりえます。ディクショナリのサイズまたは一意の値の数が過度に大きくなると,エンコードは自動的に平原エンコードに戻ります。镶木地板エンコードの詳細については,剧场正厅座位编码定义を参照してください。

例:(“myData写。parquet', T, 'FileType', 'parquet', 'VariableEncoding', 'plain')

例:(“myData写。parquet', T, 'FileType', 'parquet', 'VariableEncoding', {'plain' '字典' 'plain'})

使用する铺バージョン。“1.0”または“2.0”のいずれかとして指定します。既定では,“2.0”が最も効率的なストレージを提供しますが,拼花形式をサポートする外部アプリケーションとの最も幅広い互換性を実現するために“1.0”を選択することもできます。

注意

拼花1.0版本には,uint32型の変数をラウンドトリップできないという制限があります(こうした変数はint64としてMATLABに読み戻されます)。

制限

場合によっては,写入(location, T, 'FileType', type)は元の配列Tを正確には表さないファイルを作成します。数据存储(位置)を使用してファイルを読み取る場合,結果の形式や内容は元の高表と同じではない可能性があります。

  1. “文本”および“表格”のファイルタイプでは,は以下のルールを使用します。

    • longG形式を使用して数値変数を出力し,直言変数,文字変数,または字符串変数を引用符なしのテキストとして出力する。

    • 複数の列をもつ非テキスト変数に対し,は区切り記号のある複数のフィールドを各行に出力し,ファイルの最初の行で用いる適切な列見出しを構成する。

    • は,次元数が2を超える変数を2次元の変数として,後続の次元を折りたたんで出力する。

    • 数値,逻辑,文字,または直言のコンテンツをもつ,细胞値の指定された変数に対し,は各细胞のコンテンツを単一の行として,区切り記号のある複数のフィールドに出力する。细胞に異なったデータ型がある場合,は単一の空のフィールドを出力する。

    高配列の正確なチェックポイントを書き込む必要がある場合は,“文本”“表格”のファイルタイプを使用しないでください。

  2. “铺”ファイルタイプの場合,拼花形式がMATLAB表または时间表のデータ型を完全に表現できない場合があります。parquetreadまたは数据存储を使用してファイルを読み取る場合,結果の形式や内容は元の高表と同じではない可能性があります。詳細については,Apache铺データ型のマッピングを参照してください。

ヒント

  • 特に大きなデータセットで作業している場合は,関数を使用して,作業しているデータの”チェックポイント”または”スナップショット”を作成します。このプラクティスによって,高配列を生成したコマンドをすべて再実行するのではなく,ディスク上のファイルから直接に高配列を再構成できます。

拡張機能

高配列
メモリの許容量を超えるような多数の行を含む配列を計算します。

R2016bで導入