当使用强化学习工具箱使用并行计算训练代理时,MATLAB崩溃。

15次浏览(最近30天)
我正在运行强化学习工具箱来训练一个使用并行计算的代理。
当我使用20核(+4*16GB gpu)时,它运行良好,但当使用32核/ 36核/ 40核时,MATLAB 2020a崩溃。
为什么崩盘会发生?

接受的答案

MathWorks支金宝app持团队
MATLAB可能会在尝试与10个或更多的工人同时训练一个强化学习代理时崩溃。崩溃是由于客户端和工作进程之间的通信竞争条件。
您可以通过将MATLAB更新到R2020a Update 3来避免这个错误。
为了绕过PG、DQN、DDPG、TD3、PPO代理的通信竞争条件,使用同步并行训练,配置工作者等待剧集结束后再向主机发送数据。要做到这一点,配置你的rlTrainingOptions对象,如下面的代码所示:
>> trainOptions = rlTrainingOptions;
> > trainOptions。UseParallel = true;
>> trainoptions . parallelelizationoptions . mode = "同步";
>> trainoptions . parallelelizationoptions . stepsuntildataissent = -1;
AC代理不支持使用StepsUntilDataIsSent = -1。金宝app为了避免这些代理的通信竞争条件,考虑使用基于经验的并行训练的PPO代理或基于梯度的并行训练的PG代理。

更多的答案(0)

下载188bet金宝搏


释放

R2020a

社区寻宝

在MATLAB中心找到宝藏,并发现社区如何可以帮助你!

开始狩猎!