文档帮助中心文档
获取关于Parquet文件的信息
ParquetInfo对象包含关于Parquet文件的信息,例如:文件大小、变量名称和类型、编码和压缩方案。要获取关于Parquet文件的信息,请创建ParquetInfo对象使用parquetinfo函数。
ParquetInfo
parquetinfo
信息= parquetinfo(文件名)
例子
信息= parquetinfo (文件名)返回一个信息指定的Parquet文件的文件名.
信息= parquetinfo (文件名)
信息
文件名
全部展开
Parquet文件的名称,指定为字符向量或字符串标量。ParquetInfo使用Parquet 1.0或Parquet 2.0文件。
根据文件的位置,文件名可以表现为这些形式中的一种。
位置
形式
中指定文件的名称文件名.
例子:“data.parquet”
“data.parquet”
文件夹中的文件
如果文件不在当前文件夹或MATLAB路径上的文件夹中,则指定完整或相对路径名。
例子:“C: \ myFolder \ data.parquet”
“C: \ myFolder \ data.parquet”
例子:“myDir \ myFile.ext”
“myDir \ myFile.ext”
如果文件被指定为internet统一资源定位符(URL),则文件名必须包含协议类型“http://”或“https://”和结束'?生= true”.
“http://”
“https://”
'?生= true”
例子:“http://hostname/path_to_file/my_data.parquet?生= true”
“http://hostname/path_to_file/my_data.parquet?生= true”
远程位置
如果文件存储在远程位置,则文件名必须包含用表单指定的文件的完整路径:
scheme_name: / /path_to_file/my_file.ext
scheme_name
path_to_file
my_file.ext
基于偏远的地理位置,scheme_name可以是该表中的值之一。
s3
wasb
wasbs
hdfs
有关更多信息,请参见使用远程数据.
例子:s3: / / bucketname / path_to_file / data.parquet '
s3: / / bucketname / path_to_file / data.parquet '
数据类型:字符|字符串
字符
字符串
此属性是只读的。
Parquet文件的绝对路径,指定为字符串标量。
数据类型:字符串
文件大小
文件大小以字节为单位,指定为双.
双
数据类型:双
NumRowGroups
行组的数目,指定为双.
RowGroupHeights
每个行组中的行数,指定为双.
VariableNames
变量名,指定为字符串数组。如果Parquet文件包含N变量,然后VariableNames数组是否有大小1——- - - - - -N包含变量的名称。
N
1
VariableTypes
变量数据类型,指定为字符串数组。如果Parquet文件包含N变量,然后VariableTypes数组是否有大小1——- - - - - -N包含每个变量的数据类型名。数组中的每个元素都是Parquet文件中相应变量映射到的MATLAB数据类型的名称。
VariableCompression
变量压缩算法,指定为字符串数组。如果Parquet文件包含N变量,然后VariableCompression数组是否有大小1——- - - - - -N包含压缩算法名称。数组中的每个元素都对应于用于压缩Parquet文件中该变量的压缩算法。看到parquetwrite获取支持的压缩算法列表。金宝app
parquetwrite
VariableEncoding
变量编码,指定为字符串数组。如果Parquet文件包含N变量,然后VariableEncoding数组是否有大小1——- - - - - -N包含编码方案名称。数组中的每个元素都对应于用于在Parquet文件中编码该变量的编码方案。看到parquetwrite获取支持的编码列表。金宝app
版本
“1.0”
“2.0”
拼花版本,指定为任意一种“1.0”或“2.0”.
全部折叠
使用parquetinfo函数创建ParquetInfo对象,该对象包含有关文件的信息。
信息= parquetinfo (“outages.parquet”)
文件名:"/mathworks/devel/bat/Bdoc21b/build/matlab/toolbox/matlab/demo /outages. info = ParquetInfo with properties:parquet" FileSize: 44202 NumRowGroups: 1 RowGroupHeights: 1468 VariableNames: ["Region" "OutageTime" "Loss"…变量类型:["string" "datetime" "double"…变量:["snappy" "snappy" "snappy"…变量编码:["plain" "plain" "plain" "plain"…版本:“2.0”
显示文件中第三个变量的名称、类型和压缩方案。
disp ([info.VariableNames (3) info.VariableTypes (3) info.VariableCompression (3)))
“损失”“双重”“时髦的”
parquetread|parquetwrite|parquetDatastore
parquetread
parquetDatastore
您有这个示例的修改版本。您想打开这个示例与您的编辑吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系