是否可以进行多代理强化学习在MATLAB ?

23日视图(30天)

显示旧的评论

热带雨林库马尔 2020年3月23日

0
链接

这个问题直接联系

//www.tatmou.com/matlabcentral/answers/512500-is-it-possible-to-carry-out-multi-agent-reinforcement-learning-in-matlab

评论道: Swadhin Agrawal2021年7月15日

答:接受 Harsha Priya Daggubati

我希望火车多个代理(2代理商到10)在网格地图环境函数得到相同的回报。

是可能的吗?如果是这样,建议我一些文章或书籍开始! ! !

我适应单身代理培训。

提前谢谢! ! !

接受的答案

Harsha Priya Daggubati 2020年3月26日

0
链接

直接链接到这个答案

//www.tatmou.com/matlabcentral/answers/512500-is-it-possible-to-carry-out-multi-agent-reinforcement-learning-in-matlab answer_421999

我知道你正在寻找一种方法来模拟一个多智能体强化学习的环境。不幸的是,强化学习工具箱目前不支持多智能场景。金宝app您需要编写自定义环境和训练算法等场景。

由于大量的请求这个特性,开发团队积极致力于多代理功能,它将在未来的版本。如果你决定编写自己的环境和训练算法,下面的文档将会是一个好的开始:

//www.tatmou.com/help/reinforcement-learning/matlab-environments.html

//www.tatmou.com/help/reinforcement-learning/training-and-validation.html

1评论
显示没有隐藏没有

放大 2020年7月18日

我有与他相同的想法实现,所以我希望你能看看链接帮助那些谁和我有相同的需求

登录置评。

答案(1)

Emmanouil Tzorakoleftherakis 2020年9月29日

0
链接

直接链接到这个答案

//www.tatmou.com/matlabcentral/answers/512500-is-it-possible-to-carry-out-multi-agent-reinforcement-learning-in-matlab answer_502393

R2020b释放,同时强化学习工具箱可以训练多个代理模型。金宝app请参阅以下例子供参考:

希望这有助于

6个评论
显示5年长的评论隐藏5年长的评论

Shabnam努尔 2020年12月15日

你好,谢谢你的回复。我设法解决这个问题,但看起来不是因为不正确的观察和行动的维度。

我有奇怪的问题多代理RL模型。在2代理的情况下,当我向代理提供稍微不同的观察,只有其中一个他们应该工作而产生的其他奇怪的结果(包括代理产生正确的结果,当我提供相同的观察)。如果我代理的数量增加到两个或两个以上的,我有我上面提到的错误消息。我重新核对所有连接,观察和行动维度等但我看不到任何一个问题。有趣的是,在这两种情况下,当我创建了一个新的仿真软件模型与新块(操作)没有变化,事情开始正常工作了!金宝app我遇到了一个类似的问题用不同的仿真模型在几年前,这就是为什么我创建了一个新的模型,看它是否解决了问题。我认为这可能只是一个错误的问题。你认为,卸载和重新安装Matlab 2020 b会帮助吗?

唐纳德·亚历山大 2021年4月24日

我工作在一个类似的问题,非常感谢某种类型的建议。我的问题非常类似于“训练强化学习世界上基本网格代理”,不过我想这个问题扩展到多机器人的场景与单个启动和目标坐标/代理。我已经创建了一个26 x26 gridWorld环境障碍,我有一个代理从给定的起点到终点。我希望1剂添加到gridWorld和培训所有10个机器人能完成他们的无碰撞路径。这是可能的吗?我读过很多多代理提供的例子,然而,他们似乎不同于我的具体问题,我无法把我的手指在如何完成我的问题利用这些例子。任何类型的指南,可以直接我向解决方案是惊人的。

注意:我还编码一个*网格先验知识功能为每个机器人提供一个更好的集中解决方案在训练之前,但是,我不确定最好的方法来实现这一问题的办法。

谢谢您的时间和考虑。

Swadhin Agrawal 2021年7月15日

@Ari Biswas 你好先生,我已经创建了一个自定义使用rlCreateEnvTemplate多代理环境培训。然而,尽管验证使用validateEnv env,我得到以下错误:

使用rl.env”的错误。MATLABEnvironment/validateEnvironment (line 42)

有一个错误评估阶跃函数。

引起的:

索引超出了数组元素的数量(1)”。

所以,我发现这是由于预期行为在阶跃函数数组。和使用,进一步构建。我做,因为我认为,在创建代理,当我将调用的阶跃函数更新env,我将输入的数组操作的个人代理。

你能分享你的意见如何验证自定义env如这一个。

登录置评。

在回答这个问题。

类别

人工智能,数据科学和统计数据深度学习工具箱应用程序自主和控制系统强化学习

找到更多的在强化学习在帮助中心和文件交换

下载188bet金宝搏

强化学习工具箱

释放

R2019b

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!