如何保持行动之前至少值扰动,并让代理选择不同的行动值只有在干扰?

1视图(30天)
你好,
我训练强化学习DDPG代理控制应用程序。在我培训,代理试图增加每集的代理行为从一开始,我想代理保持最小值扰动发生前的动作,然后改变后的行动值扰动。如何实现这个想法吗?
谢谢你!

答案(1)

下载188bet金宝搏


释放

R2023a

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!