无法提交任务结果(Matlab并行服务器)

9次浏览(过去30天)
玛丽亚(女名)
玛丽亚(女名) 2021年12月2日
回答: 雷蒙德·诺里斯 2021年12月2日
你好,
我正在群集上运行一些测试。我创建了一个作业,并提交了几个任务。但是,我得到了以下错误
错误:不能重新运行任务,因为没有剩余的重新运行尝试(任务没有剩余的重新运行尝试。)。
原始取消的信息:
java.lang.Exception:无法提交任务结果- MATLAB现在将退出并重新启动。
我从哪里开始看呢?这个错误实际上意味着什么?这是客户端的问题,还是集群端的问题?

答案(1)

雷蒙德·诺里斯
雷蒙德·诺里斯 2021年12月2日
你好玛丽亚,
先问几个问题:
  • MATLAB并行服务器运行在哪个平台,Linux还是Windows?
  • 您正在使用哪个调度器(MJS、PBS等)?
  • 你用的是多大的泳池?
  • 每个节点有多少核?
  • 每个节点有多少RAM ?
如果你正在运行非mjs,试试下面的方法。我将同时使用批处理和parpool。
setenv (“MDCE_DEBUG”“真正的”
Cluster = parcluster;
%如果您正在使用批处理
Job = cluster.batch();
job.wait
cluster.getDebug(工作)
%如果你使用parpool
pctconfig (“preservejobs”,真正的);
Pool = cluster.parpool();
cluster.getDebug (cluster.Jobs(结束)
如果你在使用MJS
MJS = parcluster;
乔丹。ClusterLogLevel = 4;
调用批处理或parpool
mjs.getClusterLogs ()
也许日志文件将显示其他内容。要我猜的话,我打赌你的内存快用完了。

下载188bet金宝搏


释放

R2021a

社区寻宝

在MATLAB Central中找到宝藏,并发现社区如何帮助您!

开始狩猎!