主要内容

readPDFFormData

从PDF表单读取数据

描述

例子

数据= readPDFFormData (文件名将数据从PDF表单读入结构体。

数据= readPDFFormData (文件名“密码”,密码指定打开PDF表单的密码。

例子

全部折叠

从表单字段读取数据weatherReportForm1.pdf使用readPDFFormData.函数返回一个包含来自PDF表单字段的数据的结构体。

文件名=“weatherrereportform1.pdf”;data = readPDFFormData(文件名)
data =结构体字段:event_type:“雷暴风”event_narrative:“大树在大花坛和涅特雷顿之间。”

使用文件数据存储从多个文件中的表单字段读取数据。

为天气报告表单创建文件数据存储。表单被命名为“weatherReportFormN.pdf”,在那里N是表格的号码。使用通配符“*”指定文件名,以查找此结构的所有文件名。指定要读取的函数readPDFFormData,输入此函数fileDatastore使用函数句柄。

fds = fileDatastore (“weatherReportForm * . pdf”“ReadFcn”@readPDFFormData)
/tp900f9e75/textanalytics-ex39762425/weatherReportForm1.pdf';“…/ tp900f9e75 / textanalytics-ex39762425 / weatherReportForm2.pdf”;“…/ tp900f9e75 / textanalytics-ex39762425 / weatherReportForm3.pdf”……{'/tmp/Bdoc21b_1757077_241949/tp900f9e75/textanalytics-ex39762425'} UniformRead: 0 ReadMode: 'file' BlockSize: Inf PreviewFcn: @readPDFFormData SupportedOutputFormats: 金宝app["txt" "csv" "xlsx" "xls"…ReadFcn: @readPDFFormData AlternateFileSystemRoots: {}

循环遍历数据存储中的文件并读取每个PDF表单。

数据= [];hasdata(fds) textData = read(fds);data =[数据;textData];结束数据
data =4×1结构阵列与字段:event_type event_narrative.

输入参数

全部折叠

文件的名称,指定为字符串标量或字符向量。

readPDFFormData金宝app只支持AcroForm PDF档案(交互式表格)。

数据类型:字符串|字符

打开PDF文件的密码,指定为字符向量或字符串标量。

例子:“skroWhtaM”

数据类型:字符串|字符

输出参数

全部折叠

输出结构。等领域的数据对应于PDF中表单字段的名称。如果表单字段名不是有效的结构字段名,那么该函数将自动编辑它们以构造有效的名称。

介绍了R2018a