主要内容

parquetinfo

获取关于Parquet文件的信息

描述

ParquetInfo对象包含关于Parquet文件的信息,例如:文件大小、变量名称和类型、编码和压缩方案。要获取关于Parquet文件的信息,请创建ParquetInfo对象使用parquetinfo函数。

创建

描述

例子

信息= parquetinfo (文件名返回一个信息指定的Parquet文件的文件名

输入参数

全部展开

Parquet文件的名称,指定为字符向量或字符串标量。ParquetInfo使用Parquet 1.0或Parquet 2.0文件。

根据文件的位置,文件名可以表现为这些形式中的一种。

位置

形式

当前文件夹或MATLAB中的文件夹®路径

中指定文件的名称文件名

例子:“data.parquet”

文件夹中的文件

如果文件不在当前文件夹或MATLAB路径上的文件夹中,则指定完整或相对路径名。

例子:“C: \ myFolder \ data.parquet”

例子:“myDir \ myFile.ext”

互联网网址

如果文件被指定为internet统一资源定位符(URL),则文件名必须包含协议类型“http://”“https://”和结束'?生= true”

例子:“http://hostname/path_to_file/my_data.parquet?生= true”

远程位置

如果文件存储在远程位置,则文件名必须包含用表单指定的文件的完整路径:

scheme_name: / /path_to_file/my_file.ext

基于偏远的地理位置,scheme_name可以是该表中的值之一。

远程位置 scheme_name
Amazon S3™ s3
Windows Azure®Blob存储 wasbwasbs
HDFS™ hdfs

有关更多信息,请参见使用远程数据

例子:s3: / / bucketname / path_to_file / data.parquet '

数据类型:字符|字符串

属性

全部展开

此属性是只读的。

Parquet文件的绝对路径,指定为字符串标量。

数据类型:字符串

此属性是只读的。

文件大小以字节为单位,指定为

数据类型:

此属性是只读的。

行组的数目,指定为

数据类型:

此属性是只读的。

每个行组中的行数,指定为

数据类型:

此属性是只读的。

变量名,指定为字符串数组。如果Parquet文件包含N变量,然后VariableNames数组是否有大小1——- - - - - -N包含变量的名称。

数据类型:字符串

此属性是只读的。

变量数据类型,指定为字符串数组。如果Parquet文件包含N变量,然后VariableTypes数组是否有大小1——- - - - - -N包含每个变量的数据类型名。数组中的每个元素都是Parquet文件中相应变量映射到的MATLAB数据类型的名称。

数据类型:字符串

此属性是只读的。

变量压缩算法,指定为字符串数组。如果Parquet文件包含N变量,然后VariableCompression数组是否有大小1——- - - - - -N包含压缩算法名称。数组中的每个元素都对应于用于压缩Parquet文件中该变量的压缩算法。看到parquetwrite获取支持的压缩算法列表。金宝app

数据类型:字符串

此属性是只读的。

变量编码,指定为字符串数组。如果Parquet文件包含N变量,然后VariableEncoding数组是否有大小1——- - - - - -N包含编码方案名称。数组中的每个元素都对应于用于在Parquet文件中编码该变量的编码方案。看到parquetwrite获取支持的编码列表。金宝app

数据类型:字符串

此属性是只读的。

拼花版本,指定为任意一种“1.0”“2.0”

数据类型:字符串

例子

全部折叠

使用parquetinfo函数创建ParquetInfo对象,该对象包含有关文件的信息。

信息= parquetinfo (“outages.parquet”
文件名:"/mathworks/devel/bat/Bdoc21b/build/matlab/toolbox/matlab/demo /outages. info = ParquetInfo with properties:parquet" FileSize: 44202 NumRowGroups: 1 RowGroupHeights: 1468 VariableNames: ["Region" "OutageTime" "Loss"…变量类型:["string" "datetime" "double"…变量:["snappy" "snappy" "snappy"…变量编码:["plain" "plain" "plain" "plain"…版本:“2.0”

显示文件中第三个变量的名称、类型和压缩方案。

disp ([info.VariableNames (3) info.VariableTypes (3) info.VariableCompression (3)))
“损失”“双重”“时髦的”
介绍了R2019a