我怎么能提供约束行为的强化学习提供的代理商吗?

6视图(30天)

显示旧的评论

Janani苏尼尔 2021年4月12日

0
链接

这个问题直接联系

//www.tatmou.com/matlabcentral/answers/799961-how-can-i-provide-constraints-to-the-actions-provided-by-the-reinforcement-learning-agent

回答: Emmanouil Tzorakoleftherakis 2021年4月13日

答:接受 Emmanouil Tzorakoleftherakis

你好,

我有强化学习环境模型2的观察和5连续操作。金宝app我想添加约束行为。

例子:

行动行动行动(1)+(2)+(3)+(4)+行动行动(5)不应超过1。

我提供的上限和下限的行动。但是,有一个通用的方法来与所有5动作值与上述约束和发送模型的价值吗?金宝app

任何帮助在同一将非常感激!

提前谢谢!

0评论
显示1年长的评论藏1年长的评论

登录置评。

在回答这个问题。

接受的答案

Emmanouil Tzorakoleftherakis 2021年4月13日

0
链接

直接链接到这个答案

//www.tatmou.com/matlabcentral/answers/799961-how-can-i-provide-constraints-to-the-actions-provided-by-the-reinforcement-learning-agent answer_674081

硬约束通常不支持在培训期间RL。金宝app您可以指定限制/约束正如上面你提到的,但这只是以根据需要输出的政策和饱和,也就是说只有最初的行动被认为是当代理收集数据/培训、不饱和(影响收敛等)。

添加一个方法软约束是通过添加惩罚奖励的信号。它仍然不能保证这将是受人尊敬的,但至少这是考虑在训练时直接改变奖励。看到这例如示例。

0评论
显示1年长的评论藏1年长的评论

登录置评。

类别

人工智能,数据科学和统计数据深度学习工具箱应用程序自主和控制系统强化学习

找到更多的在强化学习在帮助中心和文件交换

下载188bet金宝搏

强化学习工具箱

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!

我怎么能提供约束行为的强化学习提供的代理商吗?

0评论
显示1年长的评论藏1年长的评论

接受的答案

0评论
显示1年长的评论藏1年长的评论

更多的答案(0)

另请参阅

类别

标签

下载188bet金宝搏

社区寻宝

我怎么能提供约束行为的强化学习提供的代理商吗?

0评论 显示1年长的评论藏1年长的评论

接受的答案

0评论 显示1年长的评论藏1年长的评论

更多的答案(0)

另请参阅

类别

标签

下载188bet金宝搏

社区寻宝

0评论
显示1年长的评论藏1年长的评论

0评论
显示1年长的评论藏1年长的评论