我想出来。的
读
语句就是移动文件指针,如果它给了一个错误,那么指针保持不动。我解决了这个问题通过阅读功能
fileparts
获得的文件名,然后使用
试,抓
与
extractFileText
在该文件中。
我怎么跳过一个文件给一个错误当使用fileDatastore pdf文档遍历一个文件夹?
2视图(30天)
显示旧的评论
我挖掘文本从几千pdf文件到一个文件夹中使用文本分析工具。我用fileDatastore循环。一些pdf加密,这与extractFileText给了一个错误。我已经添加了一个
试,抓
段跳过这些文件,但是当它回到捕获错误
试一试
并再次读取相同的文件。循环永远不会结束。我怎么增加计数器,这样它将过去错误的文件吗?这是部分代码:
fds = fileDatastore (“文件* . pdf”,“ReadFcn”,@extractFileText);
而hasdata (fds)
%提取和文本做准备
试一试%准备锁pdf等错误
文本=阅读(fds);%这是发生错误的地方
抓
disp (“加密的pdf”);
继续
结束
文本= erasePunctuation(文本);
%等。(其他文本解析)
…
结束