如何强化学习的历史行动价值代理商吗

2视图(30天)
我想强化学习代理人的行动值在每个训练集,试图找出如果操作训练期间进行了优化。有办法行动值吗?非常感谢。

接受的答案

Emmanouil Tzorakoleftherakis
Emmanouil Tzorakoleftherakis 2021年1月28日
不清楚你是什么意思。在训练RL算法已经进行推理。您可以使用 getAction getValue 如果你想做自己做的推理。会工作吗?
5个评论

登录置评。

更多的答案(0)

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!