是学习actor-critic代理吗?

4视图(30天)
卡里姆生物gassi
卡里姆生物gassi 2021年8月21日
我建立了一个演员评论家代理微型智能电网"能源管理。它必须决定放电/充电能量之间的一组操作
总共7008次9可以采取行动步骤。我培训代理超过2000集。但是我注意到当代理cetain集开始学习, 在下一集完全落下来。我tattached培训第一250集。
我想知道我的代码有错误的。

答案(1)

艾哈迈德·r·赛义德
艾哈迈德·r·赛义德 2022年10月4日
从你的图,折现奖励值是非常大的。试着重新调节到一定值(-10,10)环境中。例如,r (t) = 10 *微型智能电网"运营成本(t) / MaxCost MaxCost在哪里每个时间步的最大可能的成本。
另一个点是您可以使用另一个代理。
我希望这些建议能解决你的问题。

下载188bet金宝搏


释放

R2021a

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!