是否可以进行多代理强化学习在MATLAB ?

23日视图(30天)
我希望火车多个代理(2代理商到10)在网格地图环境函数得到相同的回报。
是可能的吗?如果是这样,建议我一些文章或书籍开始! ! !
我适应单身代理培训。
提前谢谢! ! !

接受的答案

Harsha Priya Daggubati
Harsha Priya Daggubati 2020年3月26日
我知道你正在寻找一种方法来模拟一个多智能体强化学习的环境。不幸的是,强化学习工具箱目前不支持多智能场景。金宝app您需要编写自定义环境和训练算法等场景。
由于大量的请求这个特性,开发团队积极致力于多代理功能,它将在未来的版本。 如果你决定编写自己的环境和训练算法,下面的文档将会是一个好的开始:
1评论
放大
放大 2020年7月18日
我有与他相同的想法实现,所以我希望你能看看 链接 帮助那些谁和我有相同的需求

登录置评。

答案(1)

Emmanouil Tzorakoleftherakis
Emmanouil Tzorakoleftherakis 2020年9月29日
R2020b释放,同时强化学习工具箱可以训练多个代理模型。金宝app请参阅以下例子供参考:
  1. 火车多个代理路径跟踪控制
  2. 火车多个代理区域范围
  3. 训练多个代理执行协作任务
希望这有助于
6个评论
Swadhin Agrawal
Swadhin Agrawal 2021年7月15日
@Ari Biswas 你好先生,我已经创建了一个自定义使用rlCreateEnvTemplate多代理环境培训。然而,尽管验证使用validateEnv env,我得到以下错误:
使用rl.env”的错误。MATLABEnvironment/validateEnvironment (line 42)
有一个错误评估阶跃函数。
引起的:
索引超出了数组元素的数量(1)”。
所以,我发现这是由于预期行为在阶跃函数数组。和使用,进一步构建。我做,因为我认为,在创建代理,当我将调用的阶跃函数更新env,我将输入的数组操作的个人代理。
你能分享你的意见如何验证自定义env如这一个。

登录置评。

下载188bet金宝搏


释放

R2019b

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!