是否可以进行多代理强化学习在MATLAB ?
23日视图(30天)
显示旧的评论
我希望火车多个代理(2代理商到10)在网格地图环境函数得到相同的回报。
是可能的吗?如果是这样,建议我一些文章或书籍开始! ! !
我适应单身代理培训。
提前谢谢! ! !
0评论
接受的答案
Harsha Priya Daggubati
2020年3月26日
我知道你正在寻找一种方法来模拟一个多智能体强化学习的环境。不幸的是,强化学习工具箱目前不支持多智能场景。金宝app您需要编写自定义环境和训练算法等场景。
由于大量的请求这个特性,开发团队积极致力于多代理功能,它将在未来的版本。
如果你决定编写自己的环境和训练算法,下面的文档将会是一个好的开始:
答案(1)
Emmanouil Tzorakoleftherakis
2020年9月29日
6个评论
Swadhin Agrawal
2021年7月15日
@Ari Biswas
你好先生,我已经创建了一个自定义使用rlCreateEnvTemplate多代理环境培训。然而,尽管验证使用validateEnv env,我得到以下错误:
使用rl.env”的错误。MATLABEnvironment/validateEnvironment (line 42)
有一个错误评估阶跃函数。
引起的:
索引超出了数组元素的数量(1)”。
所以,我发现这是由于预期行为在阶跃函数数组。和使用,进一步构建。我做,因为我认为,在创建代理,当我将调用的阶跃函数更新env,我将输入的数组操作的个人代理。
你能分享你的意见如何验证自定义env如这一个。