在Matlab如何阅读PDF文件吗?
448(30天)
显示旧的评论
azizullah汗
2014年8月16日
我想阅读pdf文件做出一些改变,然后将它们保存在excel ....我已经尽力了,但每次都失败....需要你的帮助....任何努力都将不胜感激。提前谢谢.....
20的评论
azizullah汗
2014年8月16日
我想要捕捉一些数据……和i havn't written code up till now...My 1st step is to read pdf file...........thanks for comments.
杰夫•海斯
2014年8月25日
azizullah——我注意到你看着迪米特里Shvorob
从PDF文件中提取文本
在MATLAB文件交换,但有一些问题。你下载这个提交所需的两个库,并修改吗
pdfParseDemo.m
文件按作者的说明?
的一个评论在上面提交表明有一个工具叫
pdftotext
你可以称之为在MATLAB代码。你看这个吗?
杰夫•海斯
2014年8月25日
你考虑过使用
pdftotext
吗?或任何其他转换器,例如HTML呢?假设你能够将文件转换为文本,你在寻找什么?有一个页面需要的数据或从每个页面或一行. . ?
您可能希望提供PDF格式的一个例子,你想从中提取数据,并注明数据文件中你想要的。
azizullah汗
2014年8月26日
编辑:沃尔特·罗伯森
2015年5月25日
pdfParsedemo的问题:…当我模拟出现以下错误的代码
? ? ?Java异常发生:
. lang。NoClassDefFoundError: org/fontbox/afm/AFMParser
在org.pdfbox.pdmodel.font.PDFont.getAFM (PDFont.java: 350)
在org.pdfbox.pdmodel.font.PDFont.getAverageFontWidthFromAFMFile (PDFont.java: 313)
在org.pdfbox.pdmodel.font.PDSimpleFont.getAverageFontWidth (PDSimpleFont.java: 231)
在org.pdfbox.util.PDFStreamEngine.showString (PDFStreamEngine.java: 276)
错误在= = > Untitled 20
pdfstr = reader.getText (pdfdoc)% #好吧
. lang。Throwable:警告:你所做的不关闭PDF文档
在org.pdfbox.cos.COSDocument.finalize (COSDocument.java: 418)
在java.lang.ref.Finalizer。在vokeFinalizeMethod(Native Method)
在java.lang.ref.Finalizer.runFinalizer(未知来源)
在java.lang.ref.Finalizer。访问100美元(未知源)
在java.lang.ref.Finalizer FinalizerThread.run美元(未知源)
. lang。Throwable:警告:你所做的不关闭PDF文档
在org.pdfbox.cos.COSDocument.finalize (COSDocument.java: 418)
在java.lang.ref.Finalizer。在vokeFinalizeMethod(Native Method)
在java.lang.ref.Finalizer.runFinalizer(未知来源)
在java.lang.ref.Finalizer。访问100美元(未知源)
在java.lang.ref.Finalizer FinalizerThread.run美元(未知源)
. lang。Throwable:警告:你所做的不关闭PDF文档
在org.pdfbox.cos.COSDocument.finalize (COSDocument.java: 418)
在java.lang.ref.Finalizer。在vokeFinalizeMethod(Native Method)
在java.lang.ref.Finalizer.runFinalizer(未知来源)
在java.lang.ref.Finalizer。访问100美元(未知源)
在java.lang.ref.Finalizer FinalizerThread.run美元(未知源)
杰夫•海斯
2014年8月26日
Azizullah——你不包括附件。
至于错误,
AFMParser
是FontBox库的一部分。你FontBox jar文件的路径添加到您的Java类路径?我看了看
pdfParsedemo.m
脚本,它没有一个命令,你应该。如果你更新
javaaddpath (MATLAB的M: \ \我的文档\ \ PDFBox-0.7.3 \ lib \ PDFBox-0.7.3.jar PDF运动”)
道路上对应于您的工作站
PDFBox-0.7.3.jar
(或任何jar文件),那么你应该添加一个等效FontBox声明
javaaddpath (“whateverYourPathIsTo \ FontBox-someVersionIds.jar”)
(我不知道jar的名称是什么,
FontBox-someVersionIds.jar
仅仅是一个例子)。
azizullah汗
2014年8月27日
是的。我做到了。如果有任何方式将pdf转换成excel在matlab请与我分享。例如:如果我们可以加载一个pdf到另一个软件matlab的帮助下然后pdf转换成excel和输出?有可能在matlab操作另一个软件吗?谢谢
斯蒂芬妮施瓦兹
2021年1月5日
Naftali来说的评论后,还有一个方法在MATLAB PDF转换为一个图像文件。看到的:
//www.tatmou.com/matlabcentral/answers/709623-how-can-i-convert-a-scanned-pdf-to-an-image-using-matlab
接受的答案
克里斯托弗Creutzig
2017年10月16日
编辑:沃尔特·罗伯森
2017年11月4日
只是备案,文本分析工具箱R2017b(新)包括一个函数
extractFileText
将从PDF(或微软的Word)中提取文本数据文件。
0评论
答案(1)
一个错误发生
无法完成的行动,因为页面所做的更改。重新加载页面更新状态。
你也可以从下面的列表中选择一个网站
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。